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Prefácio 


Este é um livro sobre controle de sistemas 
amostrados que nasceu em sala de aula. Não 
seria exagero dizer que se tratam de notas de 
aula refinadas ao longo de semestres de uso. 
O objetivo é prover um texto que forneça 
os elementos teóricos necessários para estu- 
dos mais avançados bem como para a prática 
de controle de sistemas que são amostrados 
regularmente ao longo do tempo. A teoria 
de sistemas dinâmicos em tempo discreto é 
abordada neste livro de maneira simples e, 
sempre que possível, apela-se para a intui- 


ção, ao invés de extensos desenvolvimentos 
matemáticos. 


O livro foi composto e diagramado pen- 
sando na versão impressa. À fim de oferecer 
ao leitura uma alternativa em formato ele- 
trônico, optou-se por preparar uma versão 
Kindle. Para garantir que o conteúdo de am- 
bas as versões seja rigorosamente o mesmo, 
foi necessário abrir mão de uma diagramação 
mais elegante para a versão Kindle. 


O livro tem como público alvo alunos de 
graduação, mas pode ser usado como texto 
em disciplinas introdutórias em nível de pós- 
graduação. As principais partes do conteúdo, 
que inclui a abordagem usando funções de 
transferência e a representação em espaço de 
estados, podem ser cobertas em cursos de 


60h. 


Alguns exemplos podem ser utilizados 
como tarefas de simulação a serem realiza- 
das em sala de aula. Ao longo dos semestres, 


tem-se observado uma crescente dificuldade 
dos alunos em transportar os conceitos vis- 
tos em sala de aula e discutidos nos livros 
tanto para o contexto de simulação em com- 
putador digital como para situações práticas. 
Com o objetivo de ajudar a sanar, ainda que 
parcialmente, essa deficiência, o livro inclui e 
discute vários exemplos em que os resultados 
podem ser obtidos ou verificados utilizando 
computadores digitais. Os exemplos nesta 
obra usam comandos da plataforma Matlab. 


Ao considerar a melhor maneira de dis- 
ponibilizar este material, a opção de uma 
publicação eletrônica que me permita atua- 
lizar o documento com alguma regularidade 
pareceu-me muito atraente. Imediatamente 
reduziu a pressão interna por procurar com- 
pletar muitas lacunas e refinar muitos tre- 
chos. Agora estou mais tranquilo para dis- 
ponibilizar o que tenho, sabendo que não é 
necessário esgotar uma impressão antes de 


atualizar o texto. 


Neste momento, o conteúdo do livro in- 
clui a ementa da disciplina Controle Digi- 
tal ofertada pelo Departamento de Engenha- 
ria Eletrônica da UFMG. A carga horária 
dessa disciplina é de 60h. Acredito que se- 
riam necessárias 90h para cobrir todo o con- 
teúdo deste livro. Contudo, como alguns tó- 
picos são de revisão e outros são avançados, 
a ementa da referida disciplina pode ser co- 
berta em 60h. 


Os pré-requisitos são um curso de sinais 
e sistemas e um curso de controle clássico. 
Contudo, no presente livro muitos conceitos 
básicos são apresentados e tratados de ma- 
neira introdutória. 


O Capítulo 1 faz uma breve introdução 
ao assunto e apresenta a nomenclatura bá- 
sica. O impulso unitário e suas principais 
propriedades são brevemente revisadas nesse 
capítulo. 


A Primeira Parte do livro é composta do 
Capítulo 2 ao Capítulo 6. O Capítulo 2 
trata da representação matemática do pro- 
cedimento de amostragem bem como a de si- 
nais amostrados em tempo contínuo. Tanto 
a amostragem ideal como a real são apre- 
sentadas. O procedimento inverso, conhe- 
cido como interpolação também é apresen- 
tado nesse capítulo. O Capítulo 3 faz uma 
revisão da Transformada Z, direta e inversa. 
A Transformada Z Modificada é apresentada 
também nesse capítulo. 


A representação de sistemas em tempo 
discreto que operam em malha aberta é tra- 
tada no Capítulo 4, onde são revistos aspec- 
tos da álgebra de diagrama de blocos para 
sistemas amostrados, bem como a resposta 
em frequência desses sistemas. 


Sistemas amostrados em malha fechada 
são abordados no Capítulo 5. Discute-se 
como a localização de amostradores influen- 


cia a função de transferência de malha fe- 
chada. Discute-se um dos métodos de esta- 
bilidade de Jury, que permite determinar se 
um determinado polinômio na variável com- 
plexa z tem raízes fora da circunferência de 
raio unitário. O critério de estabilidade de 
Nyquist é revisto para sistemas em tempo 
contínuo e sua adaptação para sistemas em 
tempo discreto é discutida. A representação 
usando a Carta de Nichols é discutida e o 
método de traçado do Lugar das Raízes é re- 
visto. 


O Capítulo 6 descreve técnicas de projeto 
no domínio de transformadas, além de dis- 
cutir aspectos gerais no projeto de sistemas 
de controle. O capítulo discute exemplos de 
projeto pelo Lugar das Raízes, no domínio 
de frequência e por métodos diretos, entre 
outros. 


A Segunda Parte do livro é composta dos 
Capítulos 7, 8 e 9. O Capítulo 7 trata da 


representação em espaço de estados de equa- 
ções de diferença lineares. Alguns concei- 
tos básicos como equação característica de 
uma matriz, transformação de similaridade e 
formas canônicas são abordados nesse capí- 
tulo. A representação ou realização de um 
diagrama de blocos em malha fechada em es- 
paço de estados é tratada nesse capítulo, mas 
sem discutir o projeto do controlador, o que 
é deixado para o capítulo seguinte. 


O Capítulo 8 trata da alocação de polos 
por realimentação de estados e por realimen- 
tação da saída. Nesse contexto surgem os 
importantes conceitos de controlabilidade e 
observabilidade, também apresentados nesse 
capítulo. Observadores de estado “clássicos” 
são tratados nesse capítulo bem como obser- 
vadores de ordem reduzida e observadores fil- 
tros. 


Por fm, o Capítulo 9, novo nesta edição, 
trata da estimação de parâmetros usando o 


estimador de mínimos quadrados e da esti- 
mação de estados usando o filtro de Kalman. 
Nesse capítulo detalha-se como estimar uma 
função de transferência em z a partir de da- 
dos coletados em teste. Também, o problema 
de estimar estados no contexto estocástico é 
abordado usando o filtro de Kalman, como 
alternativa aos procedimentos determinísti- 
cos descritos no Capítulo 8. 


Desde o final de 2015 dediquei-me a pre- 
parar alguns vídeos sobre temas e exemplos 
apresentados neste livro. Acredito que tanto 
o livro complementa os vídeos, como vice 
versa. Ao longo do livro o leitor encontrará 
códigos QR referentes a vídeos sobre os as- 
suntos relacionados. A lista de vídeos pode 
ser acessada em: 


Resta-me agradecer a Deus, pela Sua infi- 
nita graça e salvação na Pessoa de Seu Filho, 
à minha esposa Janete e filhas Priscila, Ne- 
rissa e Pauline, pela constante e mui agra- 


dável companhia. A meus colegas do De- 
partamento de Engenharia Eletrônica com os 
quais compartilhamos inúmeras experiências 
de ensino e às centenas de estudantes que 
assistem a minhas aulas de maneira presen- 
cial ou por vídeo, sem os quais este mate- 
rial não teria sido organizado. Em particular 
agradeço a Leonardo Tórres por várias dis- 
cussões ao longo de muitos semestres, a Leo- 
nardo Mozelli, Bruno Teixeira, Leandro Frei- 
tas (IFMG-Betim) e a Luiz Bezerra (IFCE- 
Maracanaú) por usarem o material em suas 
aulas e por apontarem mudanças e correções. 


Luis ANTONIO AGUIRRE 
Belo Horizonte, Fevereiro de 2023 


Capítulo 1 


Introdução 


O diagrama de blocos de um sistema de con- 
trole com realimentação negativa é mostrado 
na Figura 1.1. A ideia por trás do funcio- 
namento de um sistema como esse baseia-se 
na contínua comparação da saída, ou variá- 
vel controlada, c(t) com a referência r(t). No 
diagrama, a diferença entre a referência e o 
valor da saída, e(t), que existe para todo e 
qualquer valor de t, é chamado de erro. Em 


sistemas em que r(t) e o sinal realimentado 
não são representados na mesma unidade, a 
saída do comparador e(t) é chamada de erro 
de acionamento, pois é o sinal que “aciona” o 
bloco seguinte. A lei de controle, a partir do 
sinal de erro e(t), determina m(t), chamada 
ação de controle. O projeto da lei de controle 
de tal maneira que o sistema controlado seja 
estável e tenha um comportamento adequado 
é o tema de centenas de livros de “Controle”. 


m(t) 


lei de controle sistema 


FigurA 1.1: Diagrama de um servomeca- 
nismo de tempo contínuo. 


O tema deste livro está intimamente re- 
lacionado ao sistema realimentado mostrado 
na Figura 1.1, mas com uma importante dife- 


rença. Imaginemos que, apesar de existir de 
maneira contínua — ou seja, existe um valor 
a qualquer instante de tempo —, a variável de 
saída só está disponível em instantes regular- 
mente espaçados. Por exemplo, ao se moni- 
torar a posição de um avião por um radar, a 
informação é atualizada a cada varredura e 
não de maneira contínua. 


A forma mais comum de gerar sinais que 
são discretos no tempo é por meio da amos- 
tragem de uma variável que existe continua- 
mente ao longo do tempo. O intervalo entre 
uma medida e a seguinte é conhecido como 
intervalo ou período de amostragem e é in- 
dicado por T. Essa restrição implica que 
a saída só pode ser comparada com a refe- 
rência nos instantes em que seus valores são 
conhecidos. Assim, tem-se uma sequência, 
possivelmente infinita mas contável, de valo- 
res de erro e(T), e(27), e(37),..., em vez de 
um conjunto infinito e não contável de valo- 


res que correspondem à variável contínua e(t) 
considerada dentro de um intervalo de tempo 
t E Ito,tr|, como é o caso na Figura 1.1. 
Agora, não apenas a lei de controle deve 
ser capaz de determinar uma ação a partir 
da sequência de números e(nT), n = 1,2,... 
como também essa ação é uma sequência de 
números, m(nT), n = 1,2,.... Esse cenário 
é ilustrado na Figura 1.2 em que foi indicado 
que parte do sistema de controle é normal- 
mente implementado em computador. 


l k I 
pr(nT (nT u(nT): Um(t elt 
i q lei de controle ção) > interpolador mi 4| planta (8) 
I = K I 
= 
computador :* interface à 


FiGURA 1.2: Diagrama de blocos de um sis- 
tema amostrado de controle. 


Uma peculiaridade do sistema mostrado 


na Figura 1.2 é que parte do sistema (dentro 
da linha tracejada) opera com sequências dis- 
cretas, ao passo que outra parte é de tempo 
contínuo. Sistemas com tais características 
são chamados de sistemas de dados amostra- 
dos ou, simplesmente, sistemas amostrados. 
Em particular, quando o sistema é de con- 
trole, usa-se o termo sistemas amostrados de 
controle. Por fim, se a lei de controle é im- 
plementada em computador digital, usa-se a 
denominação: controle digital. 

Sistemas digitais são amostrados por prin- 
cípio, mas há muitos outros sistemas que tam- 
bém são amostrados, mesmo sendo analógi- 
cos. Como exemplos dessa última categoria 
estão sistemas de radar e de sonar em que 


a nova informação passa a estar disponível 
a cada varredura. Contudo, a informação 
em si é analógica. Somente quando a infor- 
mação amostrada passa por uma conversão 
analógico-digital (AD) é que o resultado é 
digital. Na Figura 1.2 o conversor AD é in- 
dicado pela chave no bloco denominado in- 
terface. Nesse caso, além dos aspectos pe- 
culiares aos sistemas amostrados, em que a 
informação não é atualizada continuamente, 
estão as dificuldades relacionadas ao processo 
de quantização inerente à conversão AD (ver 
Exercício 1.4). Outros exemplos de siste- 
mas de dados amostrados que não necessaria- 
mente envolvem computadores são processos 
em que são usados procedimentos analíticos 
na medição, tais como a coleta de uma amos- 
tra de material seguido de análise realizada 
em laboratório. Em tais casos, a informação 
a respeito da variável medida só está dispo- 
nível após concluída a análise que pode levar 


horas e, em alguns casos, dias. 


O fato de um sistema amostrado de con- 
trole ter uma parte discreta e outra contí- 
nua apresenta desafios tanto de representa- 
ção, como de análise e controle. Por um lado, 
devemos ser capazes de aplicar a ação de con- 
trole discreta ao sistema, que é contínuo. O 
procedimento de transformar uma sequência 
de valores discretos em um sinal contínuo 
é chamado de interpolação. Na Figura 1.2 
o bloco chamado interpolador é responsável 
por esse procedimento de conversão digital- 
analógico (DA). Assim, sistemas amostrados 
de controle necessariamente devem utilizar 
algum tipo de interpolação. Como visto ao 
longo deste livro, os algoritmos de interpola- 
ção normalmente empregados não são ideais, 
o que deve ser levado em conta na análise e 
projeto do sistema de controle. Além disso, o 
lado de tempo discreto do sistema deve rece- 
ber uma versão amostrada do sinal de saída, 


que é contínuo. Descrever, analisar e proje- 
tar sistemas amostrados de controle é o tema 
central deste livro. Na próxima seção intro- 
duziremos brevemente alguns conceitos e no- 
menclatura. 


Na Figura 1.3a é mostrado um sinal con- 
tínuo no tempo cuja amplitude é analógica. 
Pensando nesse sinal, y(t), como uma função 
do tempo, tanto o domínio como sua imagem 
são o conjunto dos número reais. Por um 
procedimento de amostragem ideal, é pos- 
sível discretizar apenas o domínio (tempo). 
Esse caso é mostrado na Figura 1.3b. Note 
que os valores do sinal y(k) ainda pertencem 
ao eixo real, pois podem assumir qualquer 
valor. Esse sinal é discreto no tempo, mas 
analógico. 


Por fim, se o valor de y(k) for represen- 
tado em código binário com um número fi- 
nito de bits, valores (analógicos) próximos 
normalmente terão a mesma representação 


binária. Na Figura 1.3b dividimos o eixo 
das ordenadas em 4 partes iguais, o que cor- 
responde a representar y(k) usando apenas 
2 bits. Portanto, esse eixo agora também 
é discreto em essência. Sempre que o valor 
de y(k) cair dentro de uma das divisões, ele 
é representado colocando o ponto no centro 
da divisão. Portanto, utilizando uma repre- 
sentação digital de 2 bits y(k) só pode as- 
sumir 4 valores, o que explica o forte efeito 
de quantização. Se fosse usado um conversor 
de 12 bits, o domínio digital D consistiria de 
212 = 4096 possíveis valores para y(k) e os 
efeitos de quantização no sinal digital seriam 
bem menores. 


FIGURA 1.3: Representação de sinal (a) em 
tempo contínuo e analógico, (b) em tempo 
discreto e analógico (amostrado), e (c) em 
tempo discreto e digital. 


1.1 Conceitos Básicos e 
Nomenclatura 


Uma variável m(t) é considerada de tempo 
contínuo, pois t € R, ou seja, para qual- 
quer valor de tempo t, m(t) é definida. Se 
a variável m(t) for conhecida apenas em ins- 
tantes específicos de tempo tj, to, ts... em 
que tr € R, dizemos que a sequência (pos- 
sivelmente infinita mas contável) de valores 
m(tn) é um sinal de tempo discreto. Se os ins- 


tantes t, estiverem igualmente espaçados no 
tempo, ouseja, seT =ta—tn-1,N E Z, po- 
demos escrever ti = T,ta=2T,ts=3T... 
em que T € R é um valor constante chamado 
de intervalo ou período de amostragem e o 
sinal amostrado pode ser representado como 
m(nT) ou simplesmente m(k), k E Z, em que 
fica implícito o fato de que m(nT) = m(k) 
(ver Figura 1.4). Optamos por usar a repre- 
sentação m(k), em vez de m(n) ou m[n|, por 
ser mais comum em livros da área de con- 
trole. Textos na área de processamento de 
sinais comumente representam sinais discre- 
tos como mn]. 


A diferença entre as representações m(nT) 
e m(k) é sutil, mas relevante. Note que o 
domínio de m(nT) é real e tem unidade de 
tempo, ao passo que m(k) está representado 
no domínio de amostras ou observações, que 
é inteiro e adimensional. 


No caso particular deste livro, m(t), m(tn), 


(a) (b) 


| 
N k 
À E: m(ts) m(k) 
m(t) , 
O Th to bg ft ALT CLT dB k 


FIGURA 1.4: Em (a) m(t) é a curva contí- 
nua, m(t;) é o conjunto de cruzes e m(nT) é 
indicado pelos pontos, em (b) o domínio é o 
conjunto dos inteiros, onde se define o sinal 


m(k). 


[n]: ÃO 


a 


m(nT) e m(k) são analógicos, pois podem as- 
sumir qualquer valor real. 
O degrau unitário é definido como 


0, Vt<0 
io À LA VESO. A) 


A função sinc(0), mostrada na Figura 1.5, 
é definida como 


sinc(0) = EA (1.2) 


Far) 


FIGURA 1.5: Função sinc(0). 


É possível ainda definir um outro sinal 
relacionado a um sinal qualquer m(t), que 
será de grande utilidade ao longo do livro. 
Para isso, contudo, é necessário utilizar o si- 
nal mostrado na Figura 1.6a que é chamado 
de função impulso unitário, definida como 


tt) = VELO 
1 = [wa (1.3) 


[6,9] 


também conhecida como delta de Dirac em 
homenagem ao físico inglês Paul Adrien Mau- 
rice Dirac (1902-1984) que propôs seu uso 
no contexto de física quântica. O fato de 
ó(t) ser infinito para t = O é indicado na Fi- 
gura 1.6a pela seta. Portanto, para t = 0 
não faz sentido falar da “amplitude” do im- 
pulso, mas como a integral em (1.3) é finita, 
fala-se em peso. Portanto, o peso da função 
impulso unitário em t = O é um. Falando de 
maneira mais rigorosa, ó(t) não é uma fun- 
ção no sentido convencional da palavra, pois 
para o único valor de t em que não é nula, 
ela é infinita. Por essa razão, alguns autores 
referem-se a ó(t) como uma função generali- 
zada ou uma distribuição. 


A Figura 1.6b mostra o impulso unitário 
localizado em t = to, que é representado ma- 
tematicamente como ód(t — to), e também um 
sinal qualquer m(t). Uma das propriedades 
da função impulso é que seu produto por uma 


(a) (b) (c) 


1 ) 1 m(to)ó(t — to) 
| ô(t) NO mo o 


0 t 0 to t 0 to t 


FIGURA 1.6: Em (a) impulso unitário, 
(b) impulso unitário atrasado de ty > 0 e 
o sinal m(t), (c) propriedade de amostragem 
do impulso. 


função qualquer resulta em outra função im- 
pulso, mas com peso igual ao valor da função 
em to, OU seja 


t- tomb) = m(to)ó(t-to). (14) 


A propriedade indicada na Eg. 1.4, ilustrada 
na Figura 1.6c, é conhecida como a proprie- 
dade de peneiramento ou propriedade de amos- 
tragem da função impulso. Na Figura 1.6c o 
impulso foi desenhado com o tamanho igual 
ao valor de m(t) no instante to por razões pe- 
dagógicas, mas deve ser notado que todos os 


impulsos em tempo contínuo, ou seja, todas 
as funções delta de Dirac têm amplitude in- 
finita. Na Figura 1.6c o peso do impulso é o 
valor finito m(to), indicado ao lado da seta. 


[m] pós [m] 
o 
DEAR 


Um trem de impulsos é gerado espaçando 
impulsos unitários ó(t) em intervalos regula- 
res. Chamemos de T o intervalo entre um 
impulso e o seguinte. Assim, um trem de im- 
pulsos pode ser escrito como (ver Figura 1.7) 


= e ô(t— nT). (1.5) 


n——o0 


Um tipo de sinal fundamental na descri- 
ção de sistemas amostrados é dado pelo pro- 
duto de um sinal contínuo qualquer m(t) com 


| 1 | 1 1 
-27 -T 0 Tr 27 t 


FigurA 1.7: Trem de impulsos unitários 
igualmente espaçados de 7. 


(a) (b) 
m(3T)ó(t— 37) 


art] ne 


O PM sParari DA ZA SE 


FIGURA 1.8: Em (a) m*(t) é formado por 
impulsos e m(t) é indicado pela linha trace- 
jada. Em (b) mostra-se a versão discreta de 


m(t), m(k). 


o trem de impulsos definido em (1.5), ou seja, 


m(t) = m(t)ór(t) = es m(nT)ó(t — nT), (1.6) 


n=-—00 


em que a propriedade de amostragem em (1.4) 
foi utilizada. Em textos de sinais e sistemas é 
comum representar matematicamente o pro- 
cedimento de amostragem como o produto 
do sinal a ser amostrado por um trem de im- 
pulsos, como realizado em (1.6). Portanto, 
sinais no domínio do tempo indicados com 
* como no caso de m*(t) em (1.6), são si- 
nais amostrados contínuos, pois seu domínio 
ét ER (ver Figura 1.8). Uma consequência 
disso é que m*(t) contém a informação do in- 
tervalo de amostragem , que é a diferença 
temporal entre dois impulsos consecutivos. 
Por outro lado, o respectivo sinal discreto re- 
presentado por m(k) = m(nT), como discu- 
tido anteriormente e ilustrado na Figura 1.4, 
é definido no domínio dos números inteiros 
e, portanto, não contém a informação de 7 
em si mesmo. Uma outra maneira de inter- 
pretar esse fato, é que sinais discretos têm 
intervalo de amostragem normalizado e igual 


à unidade. 

No próximo capítulo voltaremos a estudar 
o sinal m*(t) e desenvolveremos sua represen- 
tação no domínio de frequência e no domínio 
de Laplace. 


Exemplo 1.1.1 


O trem de impulsos ór(t) é um sinal 
periódico com período T, ou seja, com 
frequência fundamental wo = 27/T. Por 
ser um sinal periódico, ôr(t) pode ser de- 
composto em uma série de exponenciais 
complexas com frequências múltiplas de 
wo. À sequência das ponderações dessas 
exponenciais complexas dá-se o nome de 
série de Fourier. Por definição, a n-ésima 
ponderação de um sinal periódico m(t) 


com período T' é definida como 


LTP | 
Com E) Gale cho) 
TJrp 


Para o caso em que m(t) = ór(t), tem-se 


1 (7/2 
Cs mi ôr(t)e ira 


TJrp 

So imovigt= (1.8) 
es ter-se 

IR —T/2 Vin 


em que foi usado o fato de que o inte- 
grando no intervalo de —T/2 <t< T/2 
só não é zero em t = 0 e, usando a pro- 
priedade de amostragem ou de peneira- 
mento do impulso unitário e sua defini- 
ção (1.3), chega-se ao resultado indicado. 
Como o resultado independe de n, a série 
de Fourier de ór(t) é uma sequência infi- 
nita de número reais idênticos e iguais a 


1/7. Portanto, o trem de impulsos pode 
ser representado como 


1 — nwot 
ôr()=5 5 err, (9) 


n——00 


que é um somatório infinito de compo- 
nentes harmônicos e/"ot ponderados pe- 
los respectivos valores de C, que, no caso 
do trem de impulsos, são iguais a 1/7, 
como encontrado em (1.8). 


Exemplo 1.1.2 


A partir da série de Fourier C, de um 
sinal periódico é possível obter a respec- 
tiva transformada de Fourier seguindo 
dois passos: 1) os números C, devem 
ser substituídos por impulsos com peso 


21Cn; li) tais impulsos devem ser locali- 
zados no eixo de frequência nas posições 
nao — nam 1. 

Portanto, no caso do trem de impul- 
sos, à respectiva transformada também 
é um trem de impulsos, com peso 27/T, 
localizado nas frequências n27/T, como 
ilustrado na Figura 1.9. Matematica- 
mente, tem-se que 


Ar(jw) = a 


= o(a n T) (1.10) 


n——o0 


FigurA 1.9: Trem de impulsos ór(t) 
e sua representação no (a) domínio do 
tempo e (b) domínio de frequência. 


Exemplo 1.1.3 


Neste exemplo traçamos gráficos de um 
sinal senoidal usando a plataforma Ma- 
tlab. Desejamos gerar o sinal contínuo: 
g(t) — senZm, O < E < 3 Contudo, 
como a plataforma a ser usada é exe- 
cutada em computador digital, somente 
versões de tempo discreto podem ser re- 


presentadas. Para diferenciarmos as ver- 
sões dos sinais, geramos um sinal em 
tempo discreto com intervalo pequeno 
(ôt = 1072) que chamamos de x(t) “con- 
tínuo”. Esse sinal é amostrado com T = 
lim pars gerar aqui Qua 
Deve ser notado que como x(t) também 
é discreto, a amostragem com T = 1071 
pode ser interpretada como uma deci- 
mação com fator A = 100. Os princi- 
pais comandos usados para gerar os si- 
nais e produzir os gráficos mostrados na 
Figura 1.10 estão mostrados abaixo: 


wi=2+*pi*1; Y frequência do sinal 
tf=3; Y tempo final de simulação 

% incremento do sinal “contínuo” dt 
delta=0.001; 

4% vetor de tempo “continuo” 
t=0:delta:tf-delta; 

x=sin(wl*t); ) sinal “contínuo” a(t) 


T=0.1; ) tempo de amostragem 
Delta=T/delta; Y taxa de decimação 
xe=x(1:Delta:end); Y amostragem do sinal x(t) 


4) gráfico superior 

plot(t,x,ºk-?) 

hold on 

% sinal “interpolado” T(t) 
stairs([0:length(xe)-1]*T,xe,?r?); 
% sinal próximo a x*(t) 
stem([0:length(xe)-1]+*T,xe,ºb”); 
hold off 


) gráfico inferior 
% sinal discreto a(k) 
plot([0:length(xe)-1],xe,?kx*º); 


No Capítulo 2 veremos em detalhes 
como são produzidos e como representar 
os sinais x*(t), T(t) e a(k). Neste ponto, 
o que deve estar claro é que no código 
acima a variável xe corresponde ao sinal 
discreto e comandos gráficos plot, stem 
e stairs geram gráficos com aparência 
semelhante à dos sinais x(t), a*(t) e x(t), 

respectivamente. 


(a) 


At 


1 ++ *+ * + 
Ox * * * * * 
* * * * * + 
AL, o A 0H 
0 5 10 15 20 25 30 
k 


FIGURA 1.10: Em (a) o traço suave é x(t), as linhas ver- 
ticais terminadas em “o”, se consideradas impulsos com peso 
correspondente ao valor de x(t) nos respectivos instantes em 
que aparecem, são x*(t) e as linhas horizontais que se origi- 
nam nos círculos correspondem a Z(t); em (b) tem-se o sinal 
de tempo discreto a(k). O eixo das abcissas em (a) corres- 
ponde ao tempo e em (b) a amostras. Se em (b) fizéssemos o 
gráfico de z(nT), a aparência seria idêntica, e o eixo horizontal 
coincidiria com o do gráfico em (a). 


Ao longo do livro, seguimos duas abor- 


dagens na análise e no projeto de sistemas 
amostrados de controle. Na primeira parte 
do livro usamos a representação no domínio 
de transformadas. Em particular, são usa- 
das as transformadas de Laplace, Fourier e 
a transformada Z. Ao trabalharmos nesse 
domínio, é comum utilizar funções de trans- 
ferência e respostas em frequência para re- 
presentar os subsistemas em questão. 


Na segunda parte do livro permanecemos 
no domínio de tempo discreto. Nesse do- 
mínio os subsistemas dinâmicos são repre- 
sentados por equações de diferença, ao in- 
vés de funções de transferência e respostas 
em frequência. Contudo, é conveniente uti- 
lizar uma representação vetorial para as res- 
pectivas equações de diferença. Assim, uma 
equação de diferenças de ordem n é reescrita 
como um conjunto de n equações de dife- 
rença de primeira ordem. Além disso, como 
as equações consideradas são lineares, é pos- 


sível representar esse conjunto de equações 
utilizando vetores e matrizes. Tal represen- 
tação é conhecida como a representação no 
espaço de estados. Por vezes, a transformada 
Z é utilizada no contexto da representação 
em espaço de estados a fim de chegar a cer- 
tos resultados ou mesmo para estabelecer a 
ligação que existe com o domínio de trans- 
formadas. 


Nota Histórica 


Ao final de cada capítulo deste livro, são apre- 
sentados alguns aspectos históricos do desen- 
volvimento da área de sistemas amostrados e 
controle. O objetivo é ajudar o leitor a co- 
locar o material discutido em um contexto 
histórico coerente e também mencionar os 
nomes de pessoas que fizeram contribuições 
historicamente significativas. 

Um dos primeiros livros de controle a abor- 


dar sistemas amostrados foi o de LeRoy Mac- 
Coll, que era colega de Hendrik Bode e Harry 
Nyquist na Bell Labs durante a primeira me- 
tade do Século XX. No penúltimo capítulo 
de seu livro, o Capítulo X, MacColl tratou 
de servomecanismos amostrados em 14 pá- 
ginas. Na introdução do capítulo, ele diz 
que “aparentemente, o primeiro tratamento 
de servomecanismos amostrados seguindo a 
mesma abordagem foi realizada pelo Dr. G. 
R. Stibitz” (MacColl, 1945, p.88).! Apesar 
de que a nomenclatura usada por MacColl 
é um pouco diferente da atual, ele já usava 
o “*” para indicar a transformada estrela de 
maneira semelhante à usada em (1.6). O ob- 
jetivo do capítulo de MacColl era o de esten- 


!George Robert Stibitz (1904 -1995) é internacio- 
nalmente reconhecido como um dos pais do primeiro 
computador digital. Foi pesquisador na Bell Labs 
entre 1930 e 1941. Seu trabalho inclui aritmética bi- 
nária especialmente aplicada ao controle automático 
(Hall, 2008). 


der o critério de estabilidade de seu colega, 
Nyquist, para o caso de sistemas amostrados. 


Outros autores que abordaram assuntos 
relacionados ao controle de sistemas amos- 
trados foram Rudolf Oldenbourg e Hans Sar- 
torious. Seu livro, originalmente publicado 
em alemão em 1944, foi traduzido e publi- 
cado em inglês quatro anos depois (Olden- 
bourg e Sartorius, 1948). O Capítulo 5, úl- 
timo nesse livro, trata de “regulação descon- 
tínua”. O problema abordado pelos autores 
é imaginar que a ação de controle é um sinal 
descontínuo, à semelhança de x(t), mostrado 
na Figura 1.10a. Nesse capítulo os autores 
usam a transformada bilinear (ver Sec. 3.3.1) 
para, em seguida, aplicar o critério de esta- 
bilidade de Hurwitz. A Figura 90 do livro de 
Oldengourg e Sartorious mostra as regiões de 
estabilidade no plano-z e no plano-w, usando 
essa nomenclatura. O uso de equações de 
diferença é discutido, ainda que de maneira 


preliminar. 

Os primeiros livros, em inglês, de controle 
de sistemas amostrados propriamente ditos 
foram publicados mais de dez anos depois. 


Leitura Recomendada 


É comum considerar que o primeiro livro de 
controle de sistemas amostrados publicados 
na língua inglesa é (Ragazzini e Franklin, 
1958), que antecedeu em poucos meses o li- 
vro (Jury, 1958). Livros mais recentes in- 
cluem (Ástrôm e Wittenmark, 1990), que in- 
clui capítulos sobre identificação de sistemas 
e controle adaptativo; (Kuo, 1992), que traz 
um capítulo sobre controle usando micropro- 
cessadores e SDPs; (Ogata, 1995), que apre- 
senta programas em Matlab. Dentre os livros 
mais usados no ensino de controle de siste- 
mas amostrados estão (Phillips e Troy Nagle, 
1995) e (Franklin et al., 1998). 


Alguns livros mais antigos trazem deta- 
lhes sobre o aspecto digital de sistemas amos- 
trados, ou seja, aspectos relacionados a hard- 
ware, efeitos de quantização, representação 
com números binários e aspectos relaciona- 
dos (Cadzow e Martens, 1970; Jacquat, 1981). 
Em particular efeitos de quantização e aspec- 
tos numéricos da realização digital estão dis- 
cutidos nos Anexos 3.2 e 3.3 de (Castrucci e 
Sales, 1990). 


Há, na língua portuguesa, livros sobre 
controle de sistemas amostrados. Além dos 
aspectos básicos, o livro (Castrucci e Sales, 
1990) traz um capítulo sobre estudos de caso 
e (Hemerly, 2000) tem um capítulo sobre te- 
oria e implementação do filtro de Kalman 
e outro sobre estimação recursiva e controle 
adaptativo. Uma obra de destaque sobre vá- 
rios aspectos de Engenaria de Controle, que 
aborda vários assuntos cobertos no presente 
livro, é (Yoneyama, 2022), distribuído em 


formato eletrônico gratuitamente pela Edi- 
tora Blicher. 


Exercícios 


Ao longo do livro, no início dos exercícios 
de fim de capítulo, o leitor encontra tarefas 
de simulação relacionadas a um modelo não 
linear de um processo de pH. O objetivo é 
considerar esse modelo a “planta” em tempo 
contínuo, projetar e implementar leis de con- 
trole em tempo discreto para tal processo. 
Essa plataforma computacional permite tes- 
tar alguns métodos de projeto de controle. 
A aptidão de representar e simular sistemas 
dinâmicos, em malha aberta e fechada, é de 
grande valia. Acredita-se que os arquivos ofe- 
recidos são uma importante ferramenta para 
alcançar esse alvo. 

As tarefas são apresentadas procurando 
manter alguma relação com o material do ca- 


pítulo. No contexto deste capítulo introdu- 
tório, as atividade sugeridas são: 


1. baixe os arquivos em 


e instale-os na plataforma de sua con- 
veniência, isto é, Matlab ou Python; 


2. os scripts de simulação são 
simrk ph teste e 
simrk ph CD. Execute-os; 


3. o primeiro simula a planta de pH e al- 
guns modelos lineares discretos em ma- 
lha aberta. Usando um fluxograma, 
descreva os principais aspectos da si- 
mulação e indique em que scripts cada 
parte é executada; 


4. a integração numérica é realizada por 
meio de um algoritmo de Runge-Kutta 
de quarta ordem. O que é integração 
numérica? 


5. Oscript simrk ph CD simula o processo 
em malha fechada com um controlador 
simples. Que tipo de controlador foi 
implementado? 


6. Usando um fluxograma, descreva os prin- 
cipais aspectos da simulação em malha 
fechada. Explicite claramente a parte 
que corresponde à planta em tempo “con- 
tínuo” e ao algoritmo de controle em 
tempo discreto. 


1.1. Em um sistema realimentado como o 
mostrado na Figura 1.2, um sensor seria in- 
dicado no ramo de realimentação. Que hipó- 
teses devem ser feitas para suprimir o sensor 
do diagrama, como no caso da Figura 1.1? 


1.2. Considere o caso em que o sensor uti- 
lizado para realimentar a informação da va- 
riável controlada c(t) não atenda as hipóteses 
que você propôs no Exercício 1.1. Redesenhe 
o diagrama da Figura 1.1 para esse caso e ar- 
gumente de que agora e(t) não mais é o erro 
propriamente dito. 


1.3. Explique a distinção entre um sistema de 
controle discreto, um digital e um sistema de 
controle amostrado. Redesenhe o diagrama 
da Figura 1.2 para o caso de um sistema de 
controle discreto. 


1.4. O erro de quantização de uma repre- 
sentação binária varia entre —Q/2 e +Q/2, 
sendo Q = FM/2", em que FM é a faixa 
de medição do sinal e n é o número de bits. 
Assumindo que a distribuição do erro é uni- 
forme, o erro médio é zero e o desvio padrão 
é o2=Q2/12 (Ogata, 1995, p. 11). Supondo 


que um sinal é coletado via placa de aquisi- 
ção de dados com conversor AD de 12 bits 
usando uma escala de 1 a 5V, determine o 
máximo erro de quantização e sua variância. 


1.5. Seja m(t) um sinal contínuo qualquer e 
as constantes: ta, VT ER, n,k E Z. Discuta 
as semelhanças e diferenças dos seguintes si- 
nais: m(t), m(ta), m(nT) e m(k). 


Parte I 


Representação por 
Métodos de 
Transformadas 


Capítulo 2 


Amostragem e 
Interpolação 


Neste capítulo são tratados os temas rela- 
cionados à amostragem temporal de sinais 
contínuos. Descreve-se uma representação 
matemática para o processo de amostragem. 
Os efeitos da amostragem de sinais repre- 
sentados no domínio de frequência são revis- 


tos. É desenvolvida uma representação nos 
domínios de tempo e frequência para sinais 
contínuos após o processo de amostragem. 
As propriedades de tais sistemas são vistas. 
O problema da reconstrução ou interpolação 
também é tratado neste capítulo. 


2.1 Amostragem 


No contexto deste livro, amostragem refere- 
se ao procedimento de considerar apenas al- 
guns valores de um determinado sinal m(t), 
de tal maneira que suas principais caracte- 
rísticas são retidas pelo conjunto de amos- 
tras (observações) resultantes. Em estatís- 
tica, uma amostra é normalmente um con- 
junto de observações ou elementos tomados 
de uma população. Neste texto seguimos a 
nomenclatura utilizada em processamento de 
sinais e controle de sistemas amostrados em 
que por amostra nos referimos a uma ob- 


servação de um sinal ou variável. Portanto, 
amostragem é o procedimento de obter tais 
“observações” de um sinal de tempo contí- 
nuo m(t) em um conjunto de instantes de 
tempo (ty, to, ...,tn!. Se esses instantes fo- 
rem quaisquer, então fala-se em termos de 
amostragem não uniforme. Por outro lado, 
se ta — tai = T, a amostragem é uniforme 
com intervalo de amostragem T. No restante 
desta seção abordamos os procedimentos de 
amostragem ideal e não ideal discutindo as 
implicações conceituais e práticas em cada 
caso. 


2.1.1 Amostragem ideal 


Considere o sinal contínuo m(t) e sua trans- 
formada de Fourier M (jw), conforme ilustra- 
dos na Figura 2.1. 


(a) (b) 
m(t) IM(jw)] 


> > 
t —Wmax Wmax w 


FiGURA 2.1: Sinal hipotético limitado em 
banda m(t) e sua representação no (a) domí- 
nio do tempo e (b) domínio de frequência. 


Note que m(t) é um sinal limitado em 
banda, ou seja, 


M(jw) = 0, Vlw] > wmax- (2.1) 


Considere agora um outro sinal contínuo 
ór(t), que consiste de um trem de impulsos 
ô(t) espaçados no tempo de intervalos regula- 
res com duração 7. As representações desse 
sinal no domínio do tempo e de frequência 
são mostradas na Figura 2.2. 


FIGURA 2.2: Trem de impulsos ór(t) e sua 
representação no (a) domínio do tempo e 
(b) domínio de frequência. 


O trem de impulsos ór(t) pode ser re- 
presentado matematicamente por (ver Exem- 
plos 1.1.1 e 1.1.2): 


ôr(t) = 3. s(t-nT). (29) 


n——0o0 


Em (2.2), T é chamado de intervalo ou pe- 
ríodo de amostragem e os instantes nT, n E 
Z são os instantes de amostragem (lembre- 
se que nT”” € IR tem unidade de tempo). A 


frequência (ou taxa) de amostragem é dada 
por 1/7 Hz ou w, = 21/Trad/s. 

Como visto no Exemplo 1.1.2, a transfor- 
mada de Fourier de um trem de impulsos é 
também um trem de impulsos, mas no do- 
mínio de frequência, como mostrado na Fi- 
gura 2.2b, reproduzida para conveniência do 


leitor. 
ER 


Um amostrador ideal é indicado esque- 
maticamente na Figura 2.3, em que o sinal 
original m(t) aparece na entrada e o sinal 
amostrado contínuo, m*(t) é mostrado na 
saída. A chave (o amostrador) é fechada 
regularmente a cada T unidades de tempo. 
A amostragem é ideal quando a chave fica 
fechada por um intervalo que tende a zero 


(teoricamente a duração do intervalo é zero) 
e m“(t) assume exatamente o valor de m(t) 
unicamente nos instantes de amostragem. 


FIGURA 2.3: Representação de um amostra- 
dor ideal. 


Matematicamente, a amostragem ideal é 
representada pelo produto do sinal contínuo 
a ser amostrado pelo trem de impulsos ór(t) 
e o resultado é indicado por um asterisco, ou 
seja, 


m() = m(Bor(t), (2.3) 


em que é importante notar que m*(t) ainda 
é um sinal contínuo. Apesar desse sinal não 
possuir informação sobre o sinal original m(t) 
entre os instantes de amostragem, m(t) é 


definido e tem valor (nulo) em tais instantes. 
Em outras palavras, m*(t) é definido sobre 
todo o eixo t E IR. O produto indicado em 
(2.3) é comumente interpretado como uma 
modulação em “amplitude” (modulação do 
peso seria uma terminologia mais precisa), 
em que o sinal modulante é m(t) e o trem de 
impulsos ór(t) faz o papel de portadora. 

O sinal em tempo discreto correspondente 
am(t) ém(n7),n e Z oum(k), k = n. 
Como visto na Seção 1.1, a diferença entre es- 
sas representações é que o domínio de m(nT) 
é o de tempo e o domínio de m(k) é o de 
amostras, que é adimensional. 


Observação 2.1.1. Se m(t) tiver uma des- 
continuidade em algum dos instantes de amos- 
tragem, por exemplo, emt = nT,n e Z, 
convenciona-se tomar o valor à direita, ou 
seja, 

m(nT) = lim m(nT + 6). 


es 0+ 


O procedimento de amostragem ideal é 
ilustrado esquematicamente na Figura 2.4. 
As representações de m*(t) nos domínios de 
tempo e frequência são mostradas nas figu- 
ras 2.4 e 2.5, respectivamente. Para compre- 
ender o resultado mostrado na Figura 2.5, 
lembre-se que aplicando a transformada de 
Fourier à Eq. 2.3 resulta em 


M(juo) = -M(jo) * Ar(ju), (24) 


e que à convolução de uma função qualquer 
por um impulso é a “réplica” da função na 
posição do impulso multiplicada pelo peso 
do impulso e pelo fator 1/27. Portanto, fa- 
zendo a convolução de |IM(jw)| (Fig. 2.5a) 
com Ar(jw) = |Ar(jw)| (Fig. 2.5b) e divi- 
dindo por 27, chega-se a |M*(jw)| (Fig. 2.5c) 
(ver Exercício 2.1). 

A condição para que as réplicas do espec- 
tro de m(t) não se sobreponham pode ser di- 


t -707T t 


FIGURA 2.4: Representação esquemática do 
processo de amostragem ideal no domínio do 
tempo: (a) sinal original, em (b) trem de im- 
pulsos e (c) sinal amostrado em tempo con- 
tínuo m*(t) = m(tór(t). 


retamente obtida da Figura 2.5c como sendo: 


E 27 
Wmax q — Wmax 
Tr 
Diu. SE As: (2:56) 


Esse é o resultado do teorema da amostra- 


(a) (b) 
IM (go) |Ar(jw)] 


max 


FIGURA 2.5: Representação esquemática do 
processo de amostragem ideal no domínio de 
frequência: módulo da transformada de Fou- 
rier do (a) sinal original, em (b) trem de im- 
pulsos e (c) sinal amostrado em tempo con- 
tino [M*(juo)] = [E M(juo) + Ar(jo) 


gem. Em palavras, para sinais de banda li- 
mitada (ver Eq. 2.1) não há superposição es- 
pectral se a frequência de amostragem for 


estritamente maior que duas vezes a maior 
frequência contida no sinal. 


Por razões que ainda serão discutidas, na 
prática é comum trabalhar com frequência 
de amostragem ws > 5Wwmax OU até mesmo 
wWs > 10wmax- À sobreposição espectral ou 
falseamento é conhecido pelo seu termo em 
inglês aliasing. 


Sinais práticos raramente são limitados 
em banda por conterem ruído em altas 
frequências. A amostragem de um sinal que 
não seja limitado em banda apresenta super- 
posição espectral (ver Exercício 2.2). Na prá- 
tica, para garantir que um sinal seja limitado 
em banda, emprega-se um filtro passa bai- 
xas, cujo objetivo é fazer com que o sinal a 
ser amostrado não contenha componentes es- 
pectrais significativas acima de wWmax, OU seja, 
a condição (2.1) deve ser aproximadamente 
satisfeita pelo sinal na saída do filtro, que é 
chamado de filtro anti aliasing. Ao longo do 


livro considera-se que os sinais foram adequa- 
damente amostrados. 


Exemplo 2.1.1 


Considere o sinal senoidal m(t) = 
sen(wot) e seus valores amostrados 
monto = Sento 0 Mad: 
dleton e Goodwin, 1990). Definimos 
agora o sinal 


w(t) = sen([wo + rwst), (2.6) 


em que ws = 27/T é a frequência de 
amostragem e r € Z. Seguindo o mesmo 


procedimento realizado com m(t), os va- 
lores amostrados de w(t) são dados por 


w(nT) = sen([wo+rws]nT) 
= sen(wonT+rn27) 
= sen(wonT) = m(nT), (2.7) 


em que foi usado o fato de que rn Ee Z e 
que a função seno tem período 27. Esse 
simples desenvolvimento mostra que ape- 
sar de m(t) e w(t) terem frequências di- 
ferentes, as respectivas sequências discre- 
tas m(nT) ew(nT),n =0,1,... são in- 
distinguíveis. De fato, (2.7) reflete o fato 
de que todos os sinais contínuos que ti- 
verem frequências cuja diferença seja um 
múltiplo da frequência de amostragem, 
ao serem amostrados, resultam em sinais 
discretos compostos das mesmas frequên- 
cias (ver Exercício 2.3). O código abaixo 


foi utilizado para gerar a Figura 2.6. 
w0=2+*pi*1; Y frequência do sinal 
tf=6; / tempo final de simulacao 
% incremento do sinal “contínuo” dt 
delta=0.001; 
% vetor de tempo “continuo” 
t=0O:delta:tf-delta; 
T=0.2; ) tempo de amostragem 
ws=2*pi/T; ) frequência de amostragem 


mt=sin(w0+*t); ) sinal “contínuo” m(t) 

r=1; Y número inteiro qualquer 
wt=sin(wO+t+r*ws+*t); ) sinal “contínuo” w(t) 
% instantes de amostragem em tempo discreto 
n=1:T/delta:length(mt); 

mnT=mt (n); ) sinal discreto m(nT) 
wnT=wt(n); ) sinal discreto w(nT) 


4% ajusta tamanho de fonte 

set(gca,?FontSize?,16) 

plot(t,mt,ºk”?,t(n),mnT,ºko?,t,wt,?r-.º,t(n), 
wnT,'r*?); 

xlabel(?t?) Y legenda do eixo x 

axis([-0.1 6.1 -1.2 1.2]) 4 ajusta escalas 


FIGURA 2.6: O traço contínuo é m(t) 
e o tracejado é w(t). Os círculos e o 
os asteriscos correspondem às sequências 
m(nT) e w(nT), respectivamente. Como 
mostrado no Exemplo 2.1.1, tais sequên- 
cias são indistinguíveis. 


2.1.2 Amostragem não ideal 


O processo de amostragem descrito na Se- 
ção 2.1.1 considerou que o tempo em que a 
chave do amostrador (ver Figura 2.3) tende a 
zero. À consequência matemática dessa con- 


sideração é que a portadora, ór(t), que é mul- 
tiplicada pelo sinal a ser amostrado m(t) é 
um trem de impulsos de duração zero. 


n” E [m] 


af 


beira 
[nm] == E 


Na prática, por mais rápidos que sejam 
os circuitos eletrônicos utilizados nos conver- 
sores AD, o tempo de fechamento das chaves 
é diferente de zero. Nesse aspecto, a amos- 
tragem deixa de ser ideal. Nesta seção de- 
sejamos ver como levar esse fato em conta e 
verificar qual é o efeito resultante no processo 
de amostragem. 

Seguindo o mesmo procedimento da Se- 
ção 2.1.1, a amostragem pode ser represen- 
tada de forma matemática pelo produto 


mo () = m(Boór(t), (2.8) 


em que ôr(t) é um trem de pulsos com dura- 
ção y > 0, como ilustrado na Figura 2.7b e 
o tilde sobre m*(t) indica que a amostragem 
não é ideal. 


(a) OR 


FIGURA 2.7: Representação esquemática do 
processo de amostragem não ideal: (a) sinal 
original, em (b) trem de pulsos de largura % 
igualmente espaçados de T e (c) sinal amos- 
trado em tempo contínuo m*(t) = m(t)ór(t). 


Desejamos conhecer a representação no 


domínio de frequência do sinal m*(t). Mais 
especificamente, desejamos avaliar quais são 
as principais diferenças entre a representação 
no domínio de frequência do sinal resultante 
da amostragem ideal, ou seja, |M*(jw)| e 
IM*(jw)|. Para isso, note que o trem de pul- 
sos ór(t) pode ser descrito como a convolução 
de um trem de impulsos e um pulso de lar- 
gura y, que indicaremos por p, (t). Lembre-se 
que na convolução por um impulso, a função 
é copiada na posição do impulso, portanto 
podemos escrever 


in = rep (29) 
Substituindo (2.9) em (2.8) chega-se a 
nO) = mr) +] (210) 


Tomando a transformada de Fourier de 
(2.10) e considerando apenas o módulo tem- 


Nr (juo)l= IM (ju)|* [Ar(jo)Py(G00)] 


= [5 IM(guo)| + Ar(ju) [Pyljvo) 
=| (GoPdo),  M) 


em que na última passagem foi utilizada a 
relação (2.4). Portanto, a diferença entre o 
módulo da transformada de Fourier do sinal 
amostrado de forma ideal e o do sinal amos- 
trado de maneira não ideal é introduzida pelo 
produto da função P.(jw). Como p. (t) é um 
pulso de largura y, sua transformada de Fou- 
rier é uma função sinc (ver Figura 1.5) cujo 
primeiro cruzamento com o eixo das abcissas 
(o eixo de frequência) ocorre em w = +27 /y, 
conforme ilustrado na Figura 2.8b (ver Exer- 
cício 2.4). 

A representação no domínio de frequên- 
cia do sinal amostrado de forma não ideal 


M*(jw) é o produto da representação res- 
pectiva no caso da amostragem ideal M*(jw) 
pela função sinc P(jw), como mostrado na 
Figura 2.8c. Como discutido mais adiante, 
para que o sinal original m(t) seja recupe- 
rado, é necessário usar um interpolador, que 
sabemos comportar-se como um filtro passa 
baixas. Imaginando por agora que esse in- 
terpolador é ideal sua resposta em frequên- 
cia está indicada na Figura 2.8c por H(jw). 
Note que somente a réplica central é de in- 
teresse. Portanto, o sinal interpolado resul- 
tante da amostragem não ideal será aproxi- 
madamente igual ao sinal original, ou seja, 
mt) = m(t) se a função sinc for razoa- 
velmente plana na banda de passagem de 
H(jw). Isso é conseguido se y < T, o que é 
um resultado esperado. Assim, desde que a 
largura y dos pulsos seja bem menor que o in- 
tervalo de amostragem 7, a parte central de 
M*(jw), que é a que interessa, não é aprecia- 


velmente afetada e considerar a amostragem 
ideal não traz prejuízos à análise. Portanto, 
ao longo deste livro a amostragem é conside- 
rada ideal por ser mais simples de represen- 
tar. Os efeitos de uma interpolação não ideal 
são investigados mais adiante neste capítulo. 


(a) (b) 
Inu Iria) 


m 


—Wmax O Wmax w ar 0 


(o. 
[NE (juo)] 


FIGURA 2.8: Representação esquemática do 
processo de amostragem não ideal no domí- 
nio de frequência: módulo da transformada 
de Fourier do (a) sinal original, em (b) mó- 
dulo de uma função sinc e (c) sinal amostrado 
em tempo contínuo |M*(jw)|. 


2.2 Interpolação 


O teorema da amostragem estabelece a con- 
dição para que exista uma relação unívoca 
entre o sinal em tempo contínuo e a sequência 
discreta resultante da amostragem. Essa re- 
lação unívoca é fundamental mesmo quando 
não é necessário reconstruir o sinal original, 
pois garante que nenhuma informação se per- 
deu no processo de amostragem. 


Esta seção trata do problema de recons- 
truir o sinal original m(t) a partir da ver- 
são amostrada m*(t). Esse procedimento “re- 
verso” da amostragem é conhecido como in- 
terpolação. A motivação para investigar esse 
problema, de fato, não é necessariamente o 
de “reconstruir” o sinal original a partir de 
seus valores amostrados, mas é o de gerar 
um sinal contínuo a partir de uma sequência 
discreta de valores. A razão para isso é que, 
tipicamente, a lei de controle discreta produz 


a ação de controle na forma de uma sequên- 
cia de números que, antes de serem enviados 
à planta — que é contínua — deve ser trans- 
formada em um sinal contínuo, embora não 
necessariamente suave. 


2.2.1 Interpolação ideal 


Pela Figura 2.5c é possível ver que não ocor- 
reu sobreposição espectral em M*(jw), pois 
a extremidade superior do elemento central é 
menor que extremidade inferior do elemento 
à sua direita, ou seja, Wmax < Ws — Wmax, OU 
ainda, 

Ea DR us (2.12) 


que é a condição imposta pelo teorema da 
amostragem para que um sinal contínuo li- 
mitado em banda seja unicamente determi- 
nado por uma sequência de valores desse si- 
nal espaçados regularmente no tempo. Como 
a condição (2.12) é satisfeita por m*(t), isso 
significa que, em princípio, o sinal original 
m(t) pode ser recuperado a partir de m*(t), 
sem ambiguidade. Para isso basta utilizar o 
filtro ideal passa baixas (ver Figura 2.9): 


T, selw| <ws/2 


un À O, se lw| > ws/2. Aa) 


As seguintes expressões são verdadeiras: 


E 

“o. 

e 
| 


Mw) H (gw) 
too = SR Ent), (2.14) 


em que H(jw) é a transformada de Fourier 
de h(t). 


gs SG 0 u 


FIGURA 2.9: Filtro ideal (a) o módulo é um 
pulso e (b) a fase é nula. 


A resposta ao impulso do filtro ideal pode 
ser obtida tomando-se a transformada inversa 


de Fourier de H(jw), ou seja, 


A di 
Bib j= = H(jw)e'“*dw 


27 Jo 


29 st 
= — — | Sen 
Ws It 2 
sen (wst/2) . fwst 
= E 2.15 
wst/2 Ee (5) neérdo) 


cuja representação gráfica é mostrada na Fi- 
gura 2.10. Como a resposta em frequência 
do filtro ideal H(jw) é um pulso (veja a Fi- 
gura 2.9) a resposta ao impulso A(t), que é 
a transformada inversa de H (jw) é uma fun- 
ção sinc, que tem resposta para t < 0, ou 


seja, antes de chegar o impulso o filtro ideal 
já apresenta resposta. Por essa razão o fil- 
tro ideal é não-causal, o que limita o uso 
de H(jw) como filtro interpolador em mui- 
tos problemas práticos. 


sinc ( ae) 


FIGURA 2.10: A resposta ao impulso do fil- 
tro ideal é uma função sinc. 


Com os resultados derivados até aqui é 
possível apreciar os principais elementos do 
Teorema da Amostragem, enunciado a seguir. 


Teorema 2.2.1. Seja m(t) um sinal de 
banda limitada, ou seja, um sinal para o 
qual M(jw) = 0, Vlwl > wmax. Então, 
m(t) é determinado unicamente pelos valores 
mn 0, El dos SEO E Qldgio 


sendo ws = 21/T a frequência de amostra- 
gem e T, o intervalo de amostragem. 


Se o teorema da amostragem for aten- 
dido, o resultado indicado em (2.14) pode ser 
enunciado como um corolário do referido te- 
orema. 


Corolário 2.2.1. Se as hipóteses do Teo- 
rema 2.2.1 forem atendidas, o sinal origi- 
nal m(t) pode ser recuperado a partir de 
min), n=0, +1, +2,..., construindo-se 
o sinal mt) = 5 omnT)ó(t — nT) e 
fazendo-o passar pelo filtro ideal definido em 
(2:15): 


Atender às hipóteses do Teorema 2.2.1 é 
fundamental a fim de garantir que a sequên- 
cia de valores amostrados ainda representam 
o sinal original. Isso é importante mesmo 
que não seja necessário reconstruir o sinal 
original, pois trata-se de garantir que a re- 
presentação em tempo discreto seja correta. 


Contudo, em muitos problemas é necessário 
gerar um sinal em tempo contínuo a partir 
de valores amostrados. A esse problema é 
dado o nome de interpolação. Nesta seção 
consideramos a interpolação ideal que, como 
foi visto, requer que o interpolador seja um 
dispositivo não causal. O próximo exemplo 
mostra que outros esquemas de interpolação, 
mesmo não sendo ideais, continuam inviáveis 
para controle por serem não causais. 


Exemplo 2.2.1 


Uma maneira comumente usada em re- 
presentações gráficas em que os dados es- 
tão disponíveis somente em instantes dis- 
cretos de tempo é conectar pontos adja- 
centes por um segmento de reta, como 
mostrado na Figura 2.1la. Neste exem- 
plo desejamos investigar qual é a res- 
posta ao impulso do interpolador corres- 


pondente. 


FIGURA 2.11: (a) Efeito do interpolador 
linear, (b) a interpolação vista como a 
superposição de dois ramos da resposta 
ao impulso, (c) a resposta ao impulso re- 
sultante é não causal. 


Na Figura 2.11b indicamos por r(t) 
a reta que une dois pontos consecutivos 
e por pi(t) o ramo direito da resposta 
ao impulso chegado em T e por pa(t) o 
ramo esquerdo da resposta ao impulso 
que chega no instante 27. 


Como não sabemos ainda qual é o for- 
mato dos ramos que compõem a resposta 
ao impulso do interpolador, imaginamos 
que seja possível descrever cada um dos 
ramos pi(t) e pa(t) por polinômios de or- 
dem arbitrária 


Gn Qu qu o 
Eno o si So 


palt) 
palt) 


Como a soma desses ramos deve ser igual 
à reta de interpolação no intervalo 7 < 
t<2T (ver Exercício 2.5) escrevemos 


pi(t)+po(t) = ao + Bo + (ay + Bit 
+(as + Bot? +... 
= Y%+nt 
= r(t), T<t<2T. (2.16) 


Portanto, igualando os coeficientes de 


mesma potência em t tem-se que a; + 
8; = 0, Vj > 2. Isso implica que tanto 
pi(t) como pa(t) são segmentos de reta. 
A resposta ao impulso do interpolador li- 
near é mostrada na Figura 2.11c, onde 
claramente se constata que esse inter- 
polador é não causal. Para ver a não 
causalidade de outra maneira, note que 
enquanto não for conhecido o valor em 
t = 4T na Figura 2.11a, não é possível 
realizar a interpolação. 


O Corolário 2.2.1 indica que para recons- 
truir o sinal original perfeitamente a partir 
de suas amostras requer um filtro ideal. Na 
próxima seção consideramos o caso em que a 
interpolação não é ideal, mas é facilmente im- 
plementada na prática. Como é comum em 
problemas de engenharia, a fim de ganhar 
praticidade deve-se abrir mão da qualidade 
da interpolação. 


2.2.2 Interpolação causal 


A dificuldade prática de utilizar (2.14) como 
filtro interpolador é que o mesmo é não causal 
e, portanto, implementável. Nesta seção pro- 
curamos uma solução que seja causal. Para 
garantir a causalidade, a resposta ao impulso 
do novo interpolador, h,(t), deve ser nula 
para t < O. Imagine, portanto, um interpo- 
lador que mantém sua saída em valor corres- 
pondente ao peso do impulso recebido na sua 
entrada por um tempo de duração T, ou seja, 
a resposta ao impulso é (ver Figura 2.12): 


1, seO<t<?T 
hd = O, set>Tet<o0. (2.17) 


FIGURA 2.12: Resposta ao impulso do inter- 
polador causal conhecido como segurador de 
ordem zero. 


O interpolador definido em (2.17) é co- 
nhecido como o segurador de ordem zero e, 
às vezes, é indicado por ZOH (do inglês zero- 
order hold). A função de transferência do 
Z0H é, por definição, 

Hs) — Liho(t)s 
cia) 
dede = 


=D) = 2.18 
a 5 (2.18) 


em que 1(t) é a função degrau unitário. A 
resposta em frequência do ZOH é obtida no 
Exemplo 2.2.3 utilizando o resultado encon- 
trado no próximo exemplo. 


Exemplo 2.2.2 


Considere o pulso m(t) centrado em t = 
0, mostrado na Figura 2.13. Deseja-se 
encontrar sua transformada de Fourier, 
ou seja, 


M(jw) = / m(t)e dt. 


[6,9] 


FIGURA 2.13: Pulso de duração T cen- 
trado em zero. 


Usando a definição do sinal da Fi- 


gura 2.13 tem-se: 


MGju)= [. Ec 


em que foi utilizada a definição da fun- 
ção sinc (ver Eq. 1.2). A representação 
gráfica dessa função é mostrada na Fi- 


gura 2.14. 


FIGURA 2.14: Função Tsinc (22). 


Exemplo 2.2.3 


A resposta em frequência de um sistema 
linear é definida como a transformada de 
Fourier de sua resposta ao impulso. No 
caso do Z0H tem-se 


Holjw) = Ftho(t)) 
= ado Acende? 


e) 


S Su jw 


sendo que é possível tomar s = jw por- 
que h,(t) é absolutamente integrável e, 
portanto, a transformada de Fourier con- 
verge. A representação gráfica de H,(jw) 
pode ser vista na Figura 2.15. Como a 
resposta ao impulso do ZOH tem a forma 
de um pulso, é de esperar que o módulo 
de sua transformada de Fourier seja uma 
função sinc. Contudo, como o pulso na 
Figura 2.12 não está centrado, também é 
de se esperar que a fase da transformada 
de Fourier indique tal deslocamento. Es- 
sas expectativas se confirmam no seguinte 


desenvolvimento: 


li= eTIuT 
Ho(jw) UE 


I| 
fas 
Rs 
sã 
E tm 
TT 
q 
Dm 
NE 
2 | 
1 
al 
is 
SA 


às wT 
= pen eremo | ea 
e? 2 sinc (5) AO) 


À expressão (2.21) mostra que a resposta 
em frequência do ZOH é uma função sinc, 
com fase adicional de 4 = —wT/2, ou 
seja, com atraso puro de tempo de T/2 e 
um fator de escala igual a 7. 


O módulo da resposta em frequência do 


ZOH não é plano nem para —ws/2 < w < 
ws/2 logo nãoé um filtro ideal, ver Figura 2.15. 


Hj) | 


= $ 
—dws —3ws —2ws —us O us w, 3ws 4, wW 


FIGURA 2.15: Resposta em frequência do 
Z0H. 


Esse resultado já era previsto pelo fato de 
o ZOH ser causal. Outra consequência im- 
portante, e mais crítica ainda, é que o ZOH 
introduz na malha de controle um atraso puro 
de tempo de 7/2. Isso deve ser levado em 
conta no projeto de sistemas de controle amos- 


trado. 

Uma consequência de o Z0H não ser um 
interpolador ideal é que o sinal interpolado 
não é idêntico ao sinal original, antes da amos- 
tragem, o que é indicado por uma barra como 
visto a seguir: 


(ju) = 
M(s) 
mt) = mt) hd. 


Exemplo 2.2.4 


Consideramos o caso em que m(t) = 
coswot, cuja transformada de Fourier, 
M(jw) é mostrada na Figura 2.16a. A 
transformada de Fourier do sinal estre- 
lado m*(t) = m(t)ór(t) é mostrado Fi- 
gura 2.16b. Como é de se esperar o es- 


pectro de m(t) é replicado ao longo do 
eixo de frequência com periodicidade ws. 
Passando o sinal m*(t) por um ZOH re- 
sulta em um sinal interpolado m(t), cuja 
transformada de Fourier é mostrada na 
Figura 2.16c. 

É importante notar o efeito produ- 
zido pela amostragem ideal seguida de 
interpolação causal realizada pelo Z0H. 
Com relação a baixas frequências, nota- 
se que ela se mantém levemente distor- 
cida devido ao fato de que |H,(jw)| não 
é plana, nem mesmo em torno de w = 0. 
Quanto menor for wo em relação a ws, 
tanto menor será a distorção e os impul- 
sos na Figura 2.16a aparecem pouco ate- 
nuados na saída do Z0H. 

Além da possivelmente pequena dis- 
torção em baixas frequências, ocorre o 
aparecimento de frequências em torno de 
nos cm — SEI GÊ 2... devido ao pro- 


cesso de amostragem. Aqui vale uma ob- 
servação semelhante à que foi feita an- 
tes: quanto menor for wo em relação a 
ws, tanto menor é a contribuição dessas 
frequências no sinal interpolado. 

O raciocínio contrário é também vá- 
lido, isso é, quanto mais lenta for a amos- 
tragem, as componentes de baixa frequên- 
cia do sinal amostrado sofrem distorção 
cada vez maior, e as componentes de alta 
frequência na saída do ZOH, aquelas em 
torno de nws, n = +1, +2,..., têm im- 
portância relativa maior. 
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FIGURA 2.16: (a) Transformada de Fourier 
de m(t) = coswot, (Db) M*(jw) para frequên- 


cia de amostragem ws = 21/T, (c) M(jw). 


Para sinais com derivada primeira suave, 
o erro do segurador de ordem zero é limitado 
por (Ástrôm e Wittenmark, 1990, p. 28) 


ezou < max ( lh : (2.23) 


em que o máximo é determinado sobre o mó- 
dulo da primeira derivada do sinal que foi 


amostrado m(t) e que está sendo reconstruído. 
Como esperado, quanto maior for T, maior é 
o limite superior do erro. 


Exemplo 2.2.5 


O interpolador de ordem zero determina 
o valor do sinal interpolado no intervalo 
em questão por um polinômio de ordem 
zero m(t) = m(nT), nT <t< (n+I)T. 
Um polinômio de primeira ordem pode 
ser utilizado a fim de reduzir o erro de 
interpolação. Nesse caso tem-se: 


m(t) = m(n7)+ (2.24) 


m(n7)—-ml[(n— DT] 
T 


(t=—nT), 


para nT <t< (n+1)T sendo que a 
fração aproxima a derivada do sinal m(t) 
emt = (n-— DT. A implementação de 


(2.24) corresponde a extrapolar a reta 
que liga os dois últimos pontos disponí- 
veis, ou seja, m[(n—1)T| e m(nT), como 
ilustrado na Figura 2.17. 


FIGURA 2.17: Efeito do interpolador de 
primeira ordem. A inclinação da reta no 
intervalo nT <t < (n + 1)T é determi- 
nada pelos dois últimos valores, ou seja, 
ml(n—1)T| em(nT). O sinal interpolado 
é composto pelos trechos em negrito. 


A função de transferência do interpo- 
lador causal de primeira ordem é dado 


por (Phillips e Troy Nagle, 1995, p. 108): 


G(s) 


CJ +Ts E 


| (2.25) 


o) 


e para o caso de sinais com derivada se- 
gunda suave, o erro do interpolador é li- 
mitado por (Ástrôm e Wittenmark, 1990, 
p. 29): 


ES Timax( 


io ) » (2.26) 


em que se vê que o limite superior do erro 
é proporcional a T?2, o que pode represen- 
tar um cenário pior com respeito ao Z0H 
para valores maiores de 7. 


Exemplo 2.2.6 


Este exemplo é a continuação do Exem- 
plo 1.1.3, portanto assume-se que as va- 
riáveis x, xe, delta, t, tt e Testão 
disponíveis no workspace do Matlab. 

Deseja-se simular os sistemas indica- 
dos na Figura 2.18. Simularemos o bloco 
com função de transferência 1/(s-+1) uti- 
lizando a função lsim, que requer o sinal 
de entrada Z, que é a saída do segurador 
de ordem zero. 


FIGURA 2.18: (a) Sistema em tempo 
contínuo e (b) seu equivalente em tempo 
discreto. 


No Exemplo 1.1.3, o uso da função 
stairs permitiu gerar uma representa- 
ção gráfica para Z, mas nao se produziu 
o sinal propriamente dito que possa ser 
utilizado como entrada na função lsim. 
Isso é feito pela função zoh2.m desenvol- 
vida pelo autor para esse propósito. 


O seguinte código foi implementado 
e gera as figuras 2.19 e 2.20. É interes- 
sante notar que o modelo discreto simu- 
lado G(z) na Figura 2.18b só tem infor- 
mação da saída nos instantes de amos- 
tragem. 


% segurador de ordem zero 
[tt,xbar]=zoh2(xe,delta,T); 

4% sinais “contínuo”” e interpolado 
plotiGt ce ie tt xbar; 20) 


) definição da FT continua 

num=1; Y numerador da FT contínua 
den=[1 1]; Y denominador da FT contínua 
% simula a FT contínua 
y=Isim(num,den,xbar,t); 


% definição da FT discreta 

4% ver Exemplo 4.1.2 para um caso parecido 
numd=(1-exp(-T)); Y numerador da FT discreta 
Y% denominador da FT discreta 

dend=[1 -exp(-T)]; 

% simula a FT discreta 
yd=dlsim(numd,dend,xe); 


% gráfico dos sinais “continuo” e discreto 
plot(t,y,ºk?, [0:length(xe)-1]*T,yd,ºbx*?) 


Procure justificar o uso de 
[0:length(xe)-1]*T ao invés de 
simplesmente [0:1ength(xe)-1] na de- 
finição do eixo das abcissas no segundo 
comando plot. 

Observando o sinal interpolado x(t) 
na Figura 2.19, é possível notar que está 
deslocado à direita com respeito ao si- 
nal contínuo x(t). Esse deslocamento, é 
o atraso de 7/2 = 0,05 introduzido pelo 
segurador de ordem zero (ver Eq. 2.21). 
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FIGURA 2.19: Sinal suave x(t) e a in- 


terpolação z(t) do sinal amostrado x*(t), 
que não é mostrado na figura. 


c(t), c(kT) 


2.5 


FIGURA 2.20: Saída c(t) e a versão dis- 
ereta cinto mm 00 0d lim 
dicada por asteriscos. O sinal discreto 
c(k), k = 0,1,...30 foi obtido pela si- 
mulação de G(z) na Figura 2.18b e não 
pela amostragem de c(t). 


2.3 Representações 
de M*(s) 


No estudo de sistemas amostrados, à saída 
de cada amostrador há um sinal “estrelado”, 
como m*(t), como ilustrado na Figura 2.3. 
Dado que os sinais estrelados são comuns e 
que a planta é um sistema contínuo para o 
qual normalmente assumimos conhecer sua 
função de transferência Gp(s), é muito conve- 
niente obter expressões para a transformada 
de Laplace de m*(t), a fim de entender algu- 
mas das características de tais sinais, e tam- 
bém investigar suas propriedades. Assim, 
nesta seção são apresentadas três expressões 
distintas, mas equivalentes, para M*(s). 


2.3.1 M*(s) em função de m(t) 


O sinal m*(t) (ver Eq. 2.3 e Figura 2.4c) pode 
ser reescrito como 
m(bD= 5 m(nT)o(t-nT), (2.27) 


n——o0 


em que foi usada a propriedade de penei- 
ramento ou amostragem da função impulso 
unitário (ver Eq.1.4). A expressão (2.27) 
mostra que m*(t) é a soma de impulsos espa- 
çados regularmente no tempo em intervalos 
de duração T. Além disso, o peso dos im- 
pulsos correspondem aos valores de m(t) nos 
instantes dos respectivos impulsos. 

A fim de obtermos a primeira expressão 
para a transformada de Laplace de m*(t), 
lembremos das seguintes propriedades: 


LC, 
2. Llad(t)b=a,e 


dot Dh=e 


Aplicando tais propriedades e tomando a 
transformada de Laplace de (2.27) obtém-se 
(ver Exercício 2.6): 


Ms)= 3 m(nT)e rs, (2.28) 


Se o sinal m(t) for definido para t > 0,0 


limite inferior do somatório em (2.28) passa 
a ser n = 0. 


Exemplo 2.3.1 


Deseja-se determinar uma expressão para 


M*(s) usando (2.28) para o caso em que 
o sinal é o degrau unitário (1.1), ou seja, 
m(t) = 1(t). Portanto, temos: 


(6,0) 


uej= 5 lies O 


n=-—00 


0,0) 
(Que SD eatio (229) 


n=1 


Como 1(t) é descontínua em t = 0, 
usando (2.1.1) tomamos 1(0*) = 1 (ver 
a Observação 2.1.1) e (2.29) pode ser re- 
escrita como: 


Mis pe pe Tea. 
=I+(e TT) (e T+... (2.30) 


Lançando mão do seguinte resultado so- 


bre séries de potências 


1 
pi E se|x|<1, (2.31) 
— 


de (2.30) temos: 


] 


eo 


se o e pio) 
Efe pet 


A condição [e!s| > 1 define a região 
no plano s em que a série (2.30) con- 
verge. Portanto, [e?s| > 1 define a região 
de convergência (RC). Quando a conver- 
gência ocorre, a série converge para (1 — 
e-Ts)-1, como mostrado em (2.32). Ver 
Exercício 2.8. 


Exemplo 2.3.2 


Seguindo o mesmo procedimento do Exem- 
plo 2.3.1, pode-se obter uma expressão 
para M*(s) quando m(t) = e-“1(t), sendo 
1(t) o degrau unitário (1.1). Partindo de 
(2.28) tem-se: 


M*(s) = » em im em 


n=—0c0 


oo 
= eco O Ty ae pm emTe-—nTs 
n=1 


1 nho mi Mio E eTU2T-2Ts es 


= iNtá T(a Sho 2T(a+s) Le 3T(a+s) ( 
= jota T(a Dre esc Ei) CR 
1 


= a —T(a+s) 
E EE RC: le [El 


. Refs) > —a. (2.33) 


Tanto em (2.32) como em (2.33), as ex- 
pressões de M*(s) são escritas na forma de 
uma razão. Contudo, é fundamental notar 
que não se trata da divisão de polinômios 


em s. De fato, os denominadores dessas ra- 
zões não são polinômios em s, mas são fun- 
ções transcedentais. Uma consequência disso 
é que M*(s) tem infinitos polos, como ilus- 
trado a seguir. 


Exemplo 2.3.3 


Consideramos aqui sinal m(t) = e-“1(t). 
A transformada de Laplace desse sinal é 
M(s) = 1/(s + a), que tem um único 
polo real em s = —a. No Exemplo 2.3.2 
foi obtida a transformada de Laplace da 
versão amostrada desse sinal: 


1 1 


1% = ns 
M (s) 1-e-T(a+o+jw) l>-e-T(ato)e-jwTr? 


em que se fez s = o + jw, sendo T o 
intervalo de amostragem. Avaliemos essa 
expressão no polo de M(s), ou seja, em 


; 1 
M (s) = i = eu ga 
que tem polos sempre que ei“T = 1, 


Pela fórmula de Euler temos que e7 — 
coswT — jsenwT, que é igual a um toda 
vez que wT for um múltiplo par de 7, ou 
seja, há um polo Vw |wT = n2n,nE Z, 
ou ainda, a frequência dos polos é 


27 
= Ene = En; 
w nm nu 
Portanto, M*(s) tem polos em s = —a + 


nws, N E Z, em que w, é a frequência de 
amostragem. 


2.3.2 M*(s) é periódica em Im(s) 


À seguir é derivada uma outra expressão para 
a transformada de sinais amostrados M*(s), 
que é muito útil no estabelecimento de algu- 
mas propriedades, inclusive para confirmar 
que ela tem infinitos polos. 

Conforme visto no Exemplo 1.1.1, o trem 
de impulsos ór(t) pode ser escrito em termos 
da série de Fourier como (ver Exercício 2.7): 


(6,9) 


1 EB 
ôr(t) = 5 DE eta (2.34) 


n——00 


sendo que 27/T é a frequência fundamental 
em radianos por segundo. 


Substituindo (2.34) em (2.3) tem-se 


ne ldemt) [7 = em), (2.35) 


n——o0 


e tomando a transformada de Laplace de (2.35) 
resulta em 


M*(s) = A m(t) (5 so em) esta 


n=-—00 


E 5 o m(te (Ina. (2.36) 


A integral em (2.36) é a transformada de La- 
place de m(t), mas com s — jn% no lugar de 
s, portanto, essa expressão pode ser reescrita 
como 


[6,9] 


Ms) == >. M(s-jnws), (2.37) 


n——o0 


em que ws = = indica a frequência de amos- 


tragem. A expressão (2.37) mostra que a fun- 
ção M*(s) é uma soma infinita de versões 


de M(s) deslocadas no domínio s, ao longo 
do eixo imaginário, de jnws unidades. Por 
essa descrição é possível perceber que M*(s) 
é uma função periódica em s, com período 
fundamental jws. Esse resultado é demons- 
trado de maneira mais detalhada no próximo 
exemplo. 


Exemplo 2.3.4 


Começamos usando a Eq.2.28 a fim de 
escrever, para k € Z: 


M*(s+jkws) 


nas m(nT)e"T(stikios) 


oo 
m(nT)e "Te iknTos 


9 


m(nT)e "Tse-iknin, (2.38) 


19 


n=-—00 


Como k e n são números inteiros a se- 


gunda exponencial complexa em (2.38) é 
igual à unidade, pois 


eitniz — coskn2r — jsenkn2r = 1 


e (2.38) reduz-se a (veja a Eq. 2.28): 


(6,9) 


> me e 


n——o0 


= uno, 


Mº*(s + jkws) 


ou seja, de fato, M*(s) é uma função pe- 
riódica em s, com período fundamental 
jws. Uma representação gráfica de M*(s) 
é mostrada na Figura 2.21 em que a pe- 
riodicidade dos polos e do zero da faixa 
primária nas demais faixas complemen- 
tares está indicada. 


faixa complementar 
faixa primária 


faixa complementar 


FigurA 2.21: Representação gráfica de 
M*(s). Há uma faixa primária e infinitas 
faixas complementares. A faixa primária é 
replicada a cada jws como indicado. 


Uma consequência da periodicidade de 
M*(s) é que seus polos e zeros são também 
periódicos com período fundamental jw,. Se 
M(s) tiver um polo em s = p, então M*(s) 
terá polosem s =p, s=ptjw,s=p+ 


J2ws,.... Ào contrário, os zeros de M(s) não 
determinam unicamente os zeros de M*(s), 
mas tanto os polos quanto os zeros de M*(s) 
são periódicos no plano s em faixas horizon- 
tais de largura ws. Portanto, M*(s) normal- 
mente tem infinitos polos, como notado na 
discussão logo após o Exemplo 2.3.2. 

Na Seção 2.1, em particular na Figura 2.5, 
foi visto que a transformada de Fourier de 
m*(t) é composta de réplicas da transformada 
de Fourier de m(t) separadas de w,. Dito em 
outras palavras, M*(jw) é uma função pe- 
riódica na frequência, com período ws. Posto 
isso, não é uma surpresa que M*(s) seja pe- 
riódica, uma vez, que a transformada de Fou- 
rier é um caso particular da transformada de 
Laplace 


M(jw) = M(s)| (2.39) 
ou seja, a transformada de Fourier de uma 


função pode ser obtida avaliando a transfor- 
mada de Laplace ao longo do eixo jw se este 


s=jw 


estiver contido na região de convergência da 
transformada de Laplace. Assim, a periodi- 
cidade de M*(s) ao longo do eixo jw na Fi- 
gura 2.21 implica a periodicidade de M*(jw) 
constatada na Seção 2.1. Além disso, o pe- 
ríodo ao longo do referido eixo é ws. Uma 
consequência importante dessa última obser- 
vação é que a maior frequência possível de se 
representar na faixa primária no plano com- 
plexo ilustrado na Figura 2.21 deve ser me- 
nor que ws/2. Como ws/2 pertence simul- 
taneamente à faixa primária e à faixa com- 
plementar seguinte, essa frequência não é re- 
presentável sem aliasing, como antevisto pelo 
resultado em (2.5). 


2.3.3 M*(s) em função de M(s) 


Voltemos a considerar a expressão (2.3), mas 
agora imaginando que os sinais m(t) e o trem 
de impulsos são abertos à direita começando 


em t = 0. Tomando a transformada de La- 
place da mesma tem-se: 


M*(s) = M(s) * Af(s), (2.40) 
em que Ak(s) é a transformada de Laplace 


de óf(t) = 52 09(t — nT) e (ver Exem- 
plo 2.3.1) 


Ak(s) = 1+e TE pe T+... 
1 


A região de convergência Refsj > O é uma 
consequência de os (infinitos) polos de Af(s) 
estarem sobre o eixo jw (ver Exercício 2.9). 


A convolução complexa em (2.40) é dada por: 


1 ctjoo 
M*(s) = — M(NAk(s—A)dA 
27) c—joo 
E E a A E dA 
pes — dO, (242 
275 Je-joo ( E TE (ada) 


em que c é uma constante menor que o menor 
polo de Ai(s— À). Dessa maneira o caminho 
de integração é adequado, como discutido a 
seguir. 

É possível escrever (2.42) na seguinte 
forma (Phillips e Troy Nagle, 1995, p. 632): 


1 1 
M* = AMD) — dA, (243 
O) = MO rent (243) 


em que o caminho de integração 1 inclui to- 
dos os polos de M (À) e exclui os de AF(s—A), 
como ilustrado na Figura 2.22. 
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FIGURA 2.22: Representação do caminho de 
integração 1, que inclui os polos (hipotéticos) 
de M()) e exclui os polos de Az(s — À). 


Por fim, aplicando-se o teorema de resí- 
duos de Cauchy, chega-se a: 


Ms) = 5 tes [HO]: (2.44) 
polM() te 


em que pol[.| e res.) indicam os polos e 
os respectivos resíduos das funções nos argu- 
mentos. O resíduo de uma função F(A) no 


polo p é dado pelo seguinte limite 


. 1 am—l ai 
restPO) p= fim og aaa (APP FO, (2.45) 


em que m é a multiplicidade do polo. Se 
m > 1, o respectivo polo contribui com ape- 
nas um resíduo em (2.44). À expressão (2.44) 
é particularmente útil para obter M*(s) a 
partir de M(s). Antes de ilustrar esse fato 
com um exemplo, (2.44) pode ser generali- 
zada como 


* 1 
—kTs = —kTs 
le M] (s)=e > res MO | ; 
poliM(N)] 


k E Z. (2.46) 


No caso de k não ser um número inteiro, 
que é o que ocorre quando o atraso puro de 
tempo não é um múltiplo do tempo de amos- 
tragem, a expressão (2.46) não vale e uma 
alternativa, a ser apresentada na Seção 3.4, 
deve ser usada. 


Exemplo 2.3.5 


Deseja-se encontrar a expressão para 
M*(s) para o caso em que 


(s+3) 


O enc 


usando (2.44). Os polos de M(s) são s = 
—les = -—2. A função cujos resíduos 
serão determinados é 


1  (0+3) 1 
1-e-T(6-M) (A+I)(A4+2) 1me-T(s=M" 


M(A) (2.47) 


Aplicando a definição de resíduos à 


função (2.47) tem-se 


(A -13) 1 
Ta — (A | 1) x — = 
(P(A o) estes po 
o 1 
= = ESA) 
(A+3) 1 
T2 = (A | 2) 
(A o UA RO ses, 


il 
1-e-T(s+2)" 


Portanto, usando (2.44) chega-se a: 


J 2 1 
lie Men T—- e TR) 
2 il 
= Uau 1 = Ia 


1 (28— qjezTs 
Doce = , Be Ts)! o, 


Mº*(s) = m+rao 


emquea=-eTeB=e” são constan- 
tes que dependem do intervalo de amos- 
tragem T. Como observado anteriormente, 
mesmo que M(s) seja uma função racio- 
nal de dois polinômios em s, M*(s) não o 


é. Dito de outra forma, mesmo que M(s) 
tenha um número finito de polos e zeros, 
em geral, M*(s) tem infinitos polos e ze- 
ros, como indicado em na Eq. 2.48 (ver 
Exercício 2.9). 


O procedimento seguido no Exemplo 2.3.5 
pode ser utilizado para a determinação de 
M(z) a partir da transformada de Laplace 
M(s) via M*(s) (ver Exercício 2.10 e Com- 
plemento 4.1). 


2.4 Complementos 


Complemento 2.1. Escolha do Intervalo de 
Amostragem 


O teorema da amostragem fornece o li- 
mite mínimo para a frequência de amostra- 
gem como sendo ws > 2wmax, €eM QUe Wmax 


é a máxima frequência presente em um sinal 
de banda limitada. Na prática, mesmo com 
o uso de filtros passa-baixas anti-aliasing, O 
sinal a ser amostrado pode ter componen- 
tes espectrais com potência não desprezível 
“um pouco” acima de wmax. Por essa e ou- 
tras razões, é comum escolher a frequência 
de amostragem de um sinal de maneira um 
pouco mais relaxada (menos estrita) como 
DlUmax <tWs <1OwWmax 


A discussão anterior supôs que a escolha 
da frequência de amostragem é baseada no 
sinal a ser amostrado. E se essa escolha pre- 
cisasse ser feita tomando por base um sis- 
tema de controle ao invés dos sinais? Uma 
regra simples, normalmente útil pensando-se 
em termos de malha aberta, é que o tempo de 
amostragem seja 5 vezes menor que a cons- 
tante de tempo (dominante) do sistema (Phil- 
lips e Troy Nagle, 1995, p. 206). 


Supondo que se tenha uma resposta ao 


degrau do sistema a ser amostrado, chamando 
de t95% O tempo gasto para atingir 95% do va- 
lor em estado estacionário, o tempo de amos- 
tragem pode ser escolhido dentro da faixa 
(Isermann e Miinchhof, 2011; Santos et al., 
2019): 

tom «qq tosa (2.49) 

15 5) 

que se aproxima ao critério de escolher o tempo 
de amostragem entre 5 e 15 vezes menor que 
o tempo de subida desejado para o sistema 
em malha fechada. 

Um critério para escolha do intervalo de 
amostragem para sistemas de controle reco- 
menda que a frequência de amostragem seja 
dez vezes maior que a banda de passagem wp 
do sistema controlado, ou seja, 


tos 10 toa (2.50) 


A regra (2.50) não estabelece um limite 
máximo para a frequência de amostragem. 


Quanto maior for ws tão mais difícil fica 
a implementação do sistema de controle e 
problemas numéricos decorrentes da alta re- 
dundância entre valores consecutivos podem 
ser enfrentados na implementação de cer- 
tos algoritmos. Assim, como limite superior 
recomenda-se ws < 25wp. 

No projeto de sistemas amostrados de con- 
trole podemos utilizar como ponto de partida 
relações disponíveis para sistema contínuos 
em malha fechada tais como (Middleton e 
Goodwin, 1990, p. 154): 


ER, JM, 
e — Ê (2.51) 


e o TR 
Wtp 2,4 , 


em que t, é o tempo de subida, o é o máximo 
sobressinal, Mp é o ganho na frequência de 
ressonância do sistema em malha fechada. 
Portanto, a partir das especificações do 
sistema amostrado em malha fechada, deve- 


se estimar qual é a banda passante necessá- 
ria wp e, a partir daí, pode-se lançar mão de 
(2.50) para a escolha de ws. 

Um problema relacionado ao da escolha 
do tempo de amostragem, é a escolha do in- 
tervalo de discretização. Isso ocorre quando 
se parte de uma expressão válida em tempo 
contínuo e se deseja discretizá-la. No con- 
texto do projeto de sistemas amostrados de 
controle, o intervalo de discretização normal- 
mente coincide com o intervalo de amostra- 
gem, portanto esses problemas estão relaci- 
onados. No caso da escolha do intervalo de 
discretização, o método de discretização tem 
grande influência. Por exemplo, no caso de 
realizar a discretização pelo método de Euler 


m(kD—-m(kT—T) 


m(kT) = T À 


(2.52) 


a fim de garantir que a aproximação seja boa, 
recomenda-se que ws > 30 wp (Franklin et al., 


1998, p.61). Esse resultado é mais conser- 
vador do que o mostrado em (2.50), pois o 
procedimento considerado por Franklin e co- 
legas nesse ponto é o de realizar o projeto em 
tempo contínuo e depois discretizar o contro- 
lador. Isso não leva em conta, por exemplo, o 
efeito do Z0H e, portanto, requer um inter- 
valo de amostragem menor. Esquemas mais 
sofisticados de discretização permitem traba- 
lhar com intervalos de discretização maiores. 
O ponto a considerar é se ao discretizar se de- 
seja “emular o caso contínuo” ou projetar um 
bom sistema amostrado, mesmo que seus si- 
nais não sejam necessariamente boas aproxi- 
mações dos sinais que existiriam se o sistema 
fosse de tempo contínuo. Em geral, a emula- 
ção do caso contínuo requer intervalos de dis- 
cretização menores. Um estudo do efeito da 
escolha do intervalo de amostragem é apre- 
sentado em (Franklin et al., 1998, Cap. 3). 


Complemento 2.2. Algumas propriedade da 
transformada estrelada 
[M*(S)G(s)|" = M*(s)G*(s). (2.53) 


IM (s)G(s)] = MG (5). (2.54) 


Complemento 2.3. Pares de transformada 
de Laplace 


A Tabela 2.1 fornece alguns pares de trans- 
formada de Laplace que serão úteis ao longo 


do livro. A transformada Z de funções cor- 
respondentes está na Tabela 3.1. 
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TABELA 2.1: Pares de transformada de 


place, t > 0. 


La- 


Nota Histórica 


Um dos primeiros documentos publicados 
que tratam sobre sistemas amostrados de 
controle é livro de MacColl, em particu- 
lar o Capítulo 10 (MacColl, 1945). Nesse 
capítulo, apesar de não haver menção à 
transformada Z, é possível encontrar uma 
das primeiras menções à “transformada es- 
trelada”. De fato, MacColl apresentou ex- 
pressões muito semelhantes às equações 2.28 
e 2.37 vistas neste capítulo. As expressões 
em sua forma contemporânea foram publica- 
das em (Ragazzini e Zadeh, 1952, Eq. 5 e 
Eq. 7). 

Um dos livros historicamente mais rele- 
vantes na área de controle é Theory of Ser- 
vomechanisms editado por James, Nichols 
e Phillips (James et al., 1947). O Capí 
tulo 5 desse livro (Hurewicz, 1947) foi escrito 
pelo matemático Witold Hurewicz e é consi- 


derado por alguns como a primeira publica- 
ção na área de controle de sistemas amostra- 
dos. Nesse capítulo, Hurewicz apresentou o 
que hoje chamamos de transformada Z uni- 
lateral e, apesar de haver utilizado a variá- 
vel complexa z na referida transformada, ele 
não usou o nome pelo qual é conhecida na 
atualidade. Apesar de Hurewicz não haver 
utilizado explicitamente o “* para indicar a 
transformada estrelada, os conceitos envol- 
vidos estão claramente apresentados em seu 
capítulo. 


O teorema da amostragem foi original- 
mente provado por Claude Shannon no agora 
clássico trabalho (Shannon, 1949). Con- 
tudo, alguns dos principais elementos con- 
ceituais envolvidos já haviam sido discuti- 
dos por Harry Nyquist, que havia sido seu 
tutor na Bell Labs (Nyquist, 1928). Con- 
tudo, como é comum ocorrer em ciência, ou- 
tros pesquisadores desenvolveram resultados 


equivalentes nas primeiras três décadas do sé- 
culo XX. Entre tais pessoas estão E. T. Whit- 
taker e J. M. Whittaker, W. L. Ferrar e 
V. A. Kotelnikov (Jerri, 1977). O principal 
resultado de Shannon foi mostrar que uma 
função contínua no tempo de banda limitada 
pode ser substituída pela sequência de suas 
amostras sem perda de informação. Uma 
análise do contexto e impacto do trabalho 
de Shannon pode ser encontrado em (Pierce, 


1973). 


Leitura Recomendada 


Derivações matemáticas mais detalhadas de 
algumas das expressões discutidas no presente 
capítulo podem ser encontradas em (Hemerly, 
2000; Phillips e Troy Nagle, 1995). 


Exercícios 


Com respeito ao script simrk ph teste pede- 
se: 


1. identifique no código o intervalo de in- 
tegração e o tempo de amostragem. 
Qual é a diferença conceitual dessas va- 
riáveis no contexto do código? Quais 
são os valores usados? 


2. Em uma aplicação experimental qual 
dessas variáveis não existe? Por quê? 


3. Simule o script para diferentes valo- 
res de tempo de amostragem. Mante- 
nha constante o intervalo de integra- 
ção. Discuta as diferenças encontra- 
das? 


4. Reconheça no código onde e como se 
emula o segurador de ordem zero. 


2.1. Obtenha o resultado da Figura 2.5c por 
convolução gráfica. 


2.2. Mostre graficamente que um sinal que 
não seja limitado em banda provavelmente 
sofrerá sobreposição espectral ao ser amos- 
trado. Qual é a solução prática para contor- 
nar esse problema? 


2.3. Mostre o resultado do Exemplo 2.1.1 
graficamente no domínio de frequência. 


2.4. Usando o resultado do Exemplo 2.2.2, 
mostre que o primeiro cruzamento por zero 
em frequências positivas de |Ps(jw)| na Fi- 
gura 2.8b éw = +27/y. Quanto vale |P;(0)|? 


2.5. Seja um sinal interpolado obtido como 
m(t) = m*(t) * ha(t), em que hy(t) é dado 
na Figura 2.11. Mostre que o valor interpo- 
lado entre dois valores discretos consecutivos 


é a soma das respostas ao impulso nesse in- 
tervalo, sendo que os impulsos chegam nos 
instantes de amostragem, com peso igual ao 
valor do sinal discreto nesses instantes. 


2.6. Derive a expressão (2.28). 


2.7. Relacione a série de Fourier de ór(t) 
mostrada na Eq. 2.34 com a transformada de 
Fourier ilustrada na Figura 2.2b. 


2.8. Mostre que a região de convergência 
em (2.32) pode ser escrita como Refsj > 0. 
Comprove a região de convergência em (2.33). 


2.9. Encontre os polos de Ai(s) em (2.41). 


2.10. Determine M*(s) para o caso em que 
M(s)=a/s(s+a). 


2.11. Dado o sinal m(t)=1-e”*, encontre 
M*(s) de duas formas distintas: usando (2.28) 
e (2.44). 


2.12. Procure estabelecer uma relação entre 
os polos de M*(s) e os de M(s). Essa relação 
é também válida para os zeros? 


2.13. Obtenha a transformada estrelada 
M*(s) para os seguintes sinais: a) m(t) = 
sen(Bt), e b) m(t) = (1-et- Da (t—1). 


2.14. Obtenha a transformada estrelada 
M*(s) a partir de M(s)=1/(s+a)? pelo mé- 
todo de resíduos. 


2.15. Seja um processo dado por G(s) = 
1/s(s + 1). Considere uma malha fechada 
com realimentação unitária e compensador 
dado por D(s)=70(s+2)/(s+10). Com base 
nas dicas apresentadas no Complemento 2.1, 
discuta a escolha do tempo de amostragem 
para G(s) em malha aberta e para a malha 
fechada. Simule somente a malha fechada em 
tempo contínuo para uma entrada em degrau 


e indique as amostras que obteria se amos- 
trasse a saída com os valores escolhidos para 
T.. Comente seus resultados. 


2.16. O procedimento do Exercício 2.15 não 
corresponde à saída do respectivo sistema 
amostrado de controle, mesmo depois de efe- 
tuar a amostragem. Por quê? 


Capítulo 3 
A Transformada Z 


No Capítulo 2 foram derivadas expressões 
para a transformada de Laplace de um sinal 
amostrado, indicada por M*(s). Foi possível 
constatar (ver Seção 2.3) que, por envolver 
funções transcendentais, o número de polos 
de M*(s) é infinito. Essa característica da 
transformada de Laplace de sinais amostra- 
dos torna a sua representação e análise mais 
morosa. 


Para fins de discussão consideremos mais 
uma vez a transformada de Laplace de uma 
função degrau unitário, após ser amostrada, 
mais precisamente, após ser multiplicada por 
um trem de impulsos. Tal transformada é 
(ver Eq. 2.32): 

' 1 
Mole) = [E (981) 
em que o caráter transcendental do denomi- 
nador está explícito. Mas uma simples mu- 
dança de variáveis z < e7s permite reescre- 
ver (3.1) como 


In z 1 z 
M* | — = = 2 
(=) 1-3" = e 


que é uma função racional na nova variável z 
o que facilita a manipulação algébrica. Não 
apenas isso, mas a função racional em (3.2) 
tem apenas um polo. 

O presente capítulo é dedicado ao estudo 
e à formalização da mudança de variáveis 


2 + e!8, o que leva à assim chamada trans- 
formada Z. Portanto, a transformada Z pode 
ser interpretada como um caso particular da 
transformada de Laplace de um sinal amos- 
trado, quando a referida mudança de variá- 
veis é realizada. Neste capítulo também é 
revista a transformada Z inversa e o mape- 
amento de polos e zeros do plano s no plano 
2 via a relação z — e?*. A transformada Z 
modificada também é brevemente abordada 
neste capítulo. 


3.1 A Transformada 
Direta Z 


Formalizando o que foi visto até este ponto, 
seja um sinal contínuo m(t), que é amostrado 
com intervalo de amostragem 7. A amostra- 
gem ideal, estudada na Seção 2.1, pode ser 
representada por m*(t) = m(t)ór(t), em que 


ór(t) é um trem de impulsos unitários regu- 
larmente espaçados de T unidades de tempo. 
A transformada de Laplace de m*(t) é M*(s) 
e, finalmente, a transformada Z pode ser es- 
crita como: 


M(2) = M*(s)|, rs. (3.3) 


Usando (3.3) em (2.28) chega-se à expressão: 


[6,9] 


M(z) = > Si O e PAR (3.4) 


n——0o0 


que é conhecida como a transformada Z bi- 
lateral, pois o somatório corre de —oo à 00. 
No caso se sinais abertos à direita, ou seja, 
que tem início e avançam em tempo positivo, 
é comum usar a transformada Z unidirecio- 
nal: 


M()=5 m(nT)z”, (3.5) 


em que m(nT) é um sinal aberto à direita, 
ou seja, 


0 sen <0, 


o À m(nT) sen=0,1,2,... (0) 


Não é incomum simplificar a notação ainda 
mais e escrever m(n) ou m(k) em vez de 
m(nT). Em ambos os casos tem-se a mesma 
sequência de números, a diferença é que m(k) 
encontra-se no domínio discreto adimensio- 
nal ou domínio de amostras, no qual, por 
exemplo, m(25) indica o 25º valor do sinal 
amostrado, ou melhor, o valor de m(t) para 
t = 257. Por outro lado, o domínio de m(nT) 
é tempo, uma vez que T' tem unidade de 
tempo. Portanto, (3.4) e (3.5) são comu- 


mente escritas como: 


M(z) = >, m(k)z * 
k=-—oo (S.0) 
M(z) = Som(k)z H 


para os casos bidirecional e unidirecional, res- 
pectivamente. 

O uso de M(z) em vez M*(s) tem a van- 
tagem de que, pelo fato de M(z) não ser 
transcendental, tal função normalmente tem 
um número finito de polos, o que não ocorre 
com M*(s), conforme mostrado na Seção 2.3. 
Mesmo assim, pode não parecer convincente, 
à primeira vista, que seja vantajoso repre- 
sentar uma sequência infinita de números 

«m(—1), m(0), m(1),... em um somatório 
infinito, tal como a primeira expressão em 
(3.7). De fato, não há muita diferença prá- 
tica entre uma sequência infinita de números 


e um somatório infinito de uma série geo- 
métrica em que os pesos são tais números. 
Essa impressão pode ser verdade a menos 
que a referida série geométrica convirja para 
uma representação finita. Nesse caso, é evi- 
dente que é conveniente trabalhar com uma 
representação finita de uma sequência infi- 
nita. Isso é ilustrado no próximo exemplo. 


Exemplo 3.1.1 


Este exemplo é análogo ao Exem- 
plo 2.3.2. Seja o sinal exponencial dis- 
ereto mk) = e-2I(B) q > 0 em 
que 1(k) é o degrau unitário. O sinal 


m(k) é portanto uma sequência infinita 
de números que começa em m(0) = 1. e 
converge exponencialmente para zero, a 
uma taxa determinada pelo parâmetro a. 
Como m(k) é um sinal aberto à direita, 
usando a segunda expressão em (3.7) te- 
mos: 


M(z) = SE e —ak Feio 


k=0 
= je estar! vers O Lo 
= juE (ez 2 Nite a. D2+(e a, O RI 
il 


O EE [E pe le (8) 
—e-“z 


em que foi usado o resultado em (2.31). 
É importante notar que eº é uma cons- 
tante e que M(z) tem um único polo em 
z=e"º, Portanto, a expressão de M(z) 

m (3.8), que é uma razão de polinômios 
em z (no caso particular desse exemplo, 
o numerador é simplesmente a constante 


1), representa a sequência infinita de nú- 
meros m(k), k = 0,1,.... A razão em 
(3.8) é válida somente na região de con- 
vergência |z| > e”*. Portanto, a referida 
série infinita de números está “codificada” 
na função racional M(z), que tem apenas 
um parâmetro, o polo. Os matemáticos 
chamam M(z) de função geratriz, pois a 
sequência m(k), k = 0,1,... pode ser ge- 
rada a partir dessa função. 


Exemplo 3.1.2 


Reconsideramos o Exemplo 2.3.5, onde a 
partir de 


(s+3) 


CU TG 


encontramos sua versão estrelada 


1-(28-a)e Ts 
(I-ae-T)(1-Be-T5) 


ME (a (3.9) 
emiquea = ex ed en Uiilizando 
(3.3), a transformada Z pode ser obtida 
diretamente de (3.9) como 


 di= Bb = meo 
Mi) — EE E (3.10) 
Queen furor en Dn o 


eT e dois polos, um em z= e? e ou- 


troem 2 - eo 0 Portanto é possível 
ver que apenas os polos de M(z) estão 
relacionados aos polos de M(s) pelo ma- 
peamento z = e7s, mas não os zeros (veja 
Exercício 3.4). 


No Exemplo 3.1.1 vimos que uma série 
infinita de números pode ser representada de 


maneira compacta pela sua transformada Z 
que, atendida a região de convergência, pode 
ser escrita de forma racional, M(z). Tal fun- 
ção codifica a referida sequência de núme- 
ros m(0), m(1),..., o que explica o fato de 
que, em alguns ramos da matemática, M (2) 
é chamada função geratriz. Na próxima se- 
ção mostra-se como realizar o procedimento 
inverso. 


3.1.1 Propriedades da transfor- 
mada unilateral Z 


Começamos com propriedades que têm seus 
análogos na transformada de Laplace. 


Propriedade 3.1.1. Linearidade. Seja 
x(3) = Elo), e Y(2) = Ziyb)p. À 
transformada Z de uma combinação linear 
dos sinais w(k) = ax(k) + By(k) é igual 
à mesma combinação linear das respectivas 


transformadas, ou seja, W(z) = aX(z) + 
BY(z), em que Zfw(k)) = W(2). 


Propriedade 3.1.2. Convolução. Seja 
w(k) = x(k) x y(k) então W(2) = X(2)Y (2). 


Propriedade 3.1.3. Sinal avançado no 
tempo de um intervalo de amostragem. Se 
X(2) = Zlx(k)), então Zlx(k + 1) = 
2X(2) — zx(0). 


Começamos pela definição da transfor- 
mada unilateral Z de v(k + 1) 


Zlu(k+D) = s e(k + 1)z* 
k=0 
+e(Bz 1! +a(3)2 2 +... 
[e(1)z1 + a(9)22 + e(3)2 2 4...] 
= z[-e(0) +e(0) +e(1)2 Ir e(2)2 2ra(3)2 “4... ] 
[ 


Propriedade 3.1.4. Sinal atrasado no 
tempo de um intervalo de amostragem. Se 
X(z) = Zlx(k)), então Zlx(k — 1)) = 
2 iX(2) + 2(—1). 


Começamos pela definição da transfor- 
mada unilateral Z de x(k — 1) 


Exemplo 3.1.3 


Começamos ilustrando a Proprie- 
dade 3.1.3. Para isso consideramos 
que x(k) = 1(k) cuja transformada 
unilateral Z é X(z) — alo — 1). 


Antecipemos o sinal de um instante, 
ou seja, z(k + 1) = 1(k+ 1). Esse 
smnal é 0,Vk < —l e 1,vVk > -—1. O 
fundamental aqui é notar que para k > 0 
— que é o que interessa na transformada 
unilateral —, o sinal x(k + 1) não difere 
de x(k). Portanto, a transformada 
unilateral Z de ambos devem ser iguais. 
Verificaremos esse resultado usando a 
Propriedade 3.1.3: 


Zle(k+1)j = zX(2) — zx(0) 
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como antecipado. 

Para ilustrar a Propriedade 3.1.4, co- 
meçamos com o sinal ax(k) = 0,Vk < —1 
e x(k) = 1,Yk > —1. Note que se atra- 
sarmos esse sinal de um intervalo, o resul- 
tado x(k — 1) coincide com x(k), k > 0. 


Ou seja, a transformada Z unilateral de 
ambos deve ser iguala X(z) = z/(2—1). 
Usemos a Propriedade 3.1.4: 


Zlx(k-1)) = 2!X(2) +2(—1) 
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o que confirma o que se esperava. 


Usando a Propriedade 3.1.4, tem-se o re- 
sultado abaixo relativo à primeira diferença 


de x(k), que é x(k) — x(k — 1). 


Propriedade 3.1.5. 4 transformada Z da 
primeira diferença de x(k) é(1—-2"D)X(z) — 
g(—1). 


Utilizando a Propriedade 3.1.4 o resul- 
tado é obtido imediatamente. 


Propriedade 3.1.6. Conhecido como o Te- 
orema do valor inicial: x(0) = lim,.,oo X(2). 


Propriedade 3.1.7. Conhecido como o Te- 
orema do valor final. Se x(k) convergir para 
algum valor finito limpo L(k) = x(00) < 
oo, esse valor é dado por x(00) = lim,.,1(2— 


DX(). 


Propriedade 3.1.8. Seja X(z) a transfor- 
mada Z de v(k)1(k), então a transformada 
de y'x(k)1(k) é X (2/9). 


Propriedade 3.1.9. Seja X(z) a transfor- 
mada Z de v(k)1(k), então a transformada 
de ka(k)1(k) é -zEX(2). 


Nas duas últimas propriedades 1(k) é o 
degrau unitário em tempo discreto, ou seja, 


Mk)=1,k>0€e1(k)=0,k<0. 


Exemplo 3.1.4 


A partir do par de transformadas 


Eat Z,t=kT Z 

e(t) —— ES CET 

e da Propriedade 3.1.3, desejamos obter 
a(k) para X(2) = y/(z — q). Para re- 
solver o exercício, manipularemos os pa- 
res até chegarmos no resultado desejado. 
Portanto 


e T(kT) + 


e a 


em que no último passo foi usada a Pro- 
priedade 3.1.3 com x(—1) = 0. 


3.2 A Transformada 
Inversa Z 


Nesta seção são revistas maneiras de calcular 
a transformada inversa Z, em outras pala- 
vras, dada uma função geratriz M(z), como 
obter a sequência de números m(0), m(1),... 
que ela codifica? Como visto, há várias for- 
mas de encontrar m(n), n = 0,1,... a par- 
tir de M(z). Algumas dessas alternativas 
são apresentadas nesta seção e ilustradas com 
exemplos. 


3.2.1 Divisão polinomial 


A divisão polinomial ou divisão longa con- 
siste em dividir o polinômio do numerador 
de M(z) pelo denominador. O resultado é 
um somatório de termos na forma de (3.7), 
de modo que os coeficientes das potências em 
z são os valores no domínio de amostras, ou 
seja, os valores obtidos após a transformada 
inversa. O procedimento é simples, mas nor- 
malmente não fornece uma expressão fechada 
para a transformada inversa. 


[Ep 


[aj iris 


Exemplo 3.2.1 


Neste e nos próximos exemplos é utili- 
zada a seguinte função racional: 


102z+5 102+5 


» (3.11 
(z—1)(z—-0,2) 22-1,22+0,2 Ra) 


Mi) = 


que é a transformada Z de um sinal aberto 
à direita, ou seja, é um sinal produzido 
por um sistema causal. Deseja-se obter, 
por divisão longa, a transformada inversa 
Z,ou seja, m(k), k = 0, 1,.... Começa- 
mos escrevendo os dois polinômios, como 
indicado na primeira linha a seguir e pro- 
curamos o fator que multiplicado por sé 


resulte em 10z. Esse fator é 1027! e é es- 
crito logo no início da linha do resultado. 


102 +45 (E2 = LPs 

(=) 102 —12 SD Oz mam... 
0 +17 =p! 

(6) dit =A0d to dee 


0 18,427) SE e 


Multiplicando todo o denominador por 
102-!, obtém-se 10z — 12 + 277!, que 
é escrito à esquerda, debaixo do polinô- 
mio do numerador. Por construção, os 
dois primeiros termos coincidem. A se- 
guir subtraímos 102—12+227! de 102+5 
e indicamos o resultado abaixo da linha 
à esquerda. A partir desse ponto, o pro- 
cesso se repete indefinidamente. O termo 
a ser cancelado agora é 17, portanto, bus- 
camos o fator que multiplicado por 22 re- 
sulte em 17 e o registramos na linha do 


resultado, que está em negrito. 
Assim, a divisão longa fornece o re- 
sultado 


sa 10z+5 
(z—1)(z—0,2) 


M(z) = 07 ee (ENO) 

Comparando com o somatório em 
(3.7), nota-se que para o presente exem- 
plo = 0 = o Bic= e 


assim sucessivamente. Esse é o sinal cuja 
transformada Z é M(z) dada em (3.11). 


Exemplo 3.2.2 


Voltamos a considerar M(z) dada em 
(3.11). Imagine que ao nos prepararmos 
para realizar a divisão longa, tenhamos 
escrito os polinômios em ordem inversa, 
ou seja, 


5 +10z (p= pas A 
(—) 5 —302 42522 25 + 2002 +... 
0 4407 2522 
(—) -40z —24022  +20022 


0 21522  —20022 


Note que, ao contrário do que ocorreu no 
Exemplo 3.2.1, o resultado é uma série 


em potências crescentes de z. Isso indica 
uma série temporal aberta à esquerda, ou 
seja, m(0) = 25, m(—1) = 200, m(—2) = 
1075 e assim por diante. O fato de dois 
sinais diferentes, um aberto à direita e 
outro à esquerda, terem a mesma trans- 
formada Z é um resultado conhecido da 
teoria de sinais e sistemas. Essa é a razão 
pela qual, além da expressão de M(z), 
deve-se fornecer alguma informação adi- 
cional como, por exemplo, a região de 
convergência, ou o fato de o sinal em 
questão ser aberto à direita. No presente 
livro trata-se quase que exclusivamente 
de sistemas causais e de sinais abertos 
à direita. Portanto, ao fazer a divisão 
longa é importante verificar que o resul- 
tado esteja na forma de uma série de po- 
tências em z”!, como indicado em (3.12). 


3.2.2 Frações parciais 


Uma das maneiras mais práticas de fazer a 
transformada inversa é consultar uma tabela 
de pares transformados. Um benefício adicio- 
nal desse procedimento é que o resultado nor- 
malmente aparece em forma fechada. Con- 
tudo, o número de frações que se encontram 
em tabelas típicas é relativamente pequeno. 
O procedimento da decomposição em frações 
parciais objetiva reescrever uma razão de po- 
linômios como o somatório de parcelas meno- 
res, que se encontrem na tabela. Este proce- 
dimento só se aplica a funções racionais es- 
tritamente próprias. 


Exemplo 3.2.3 


Neste exemplo seguimos o procedimento 
de frações parciais e consulta à tabela de 
transformada. (Como a função racional 
M(z) não tem polos repetidos, podemos 
decompô-la em 

102 +5 AB 


DO eae 


As constantes 4 e B podem ser determi- 
nadas pelo método dos resíduos: 


102 +5 1 
= é 1] | = É Sar 
(2 — 1)(z — 0,2) —1 0,8 
102 +5 7 
= É (2- 0,2) =D. aim 
(z — 1)(z — 0,2) »=0,2 0,8 


Portanto, a transformada inversa é 
dada por (ver Exemplo 3.1.4) 


m(k) = 18,75(1)*-l1(k — 1) — 8,75(0,2)* Ii (k — 1) 
18,751(k — 1) — 8,75(0,2)* (0,2) 11(k — 1) 


= [18,75 — 43,75(0,2)*]1(k — 1), (3.14) 


que está em forma fechada. Fazendo k = 
0, tem-se m(0) = 0, pois por definição o 
degrau atrasado de uma posição, 1(k—1), 
tem valor nulo em k = 0. Para k = 
1 temos m(1) = [18,75 — 48,75(0,2)| = 
10, Para Para k = 2: mb) [1800 — 
43,75(0,2)2] = 17, que coincide com o re- 
sultado obtido no Exemplo 3.2.1. 


Exemplo 3.2.4 


No Exemplo 3.2.3 obtivemos um resul- 
tado que inclui o fator 1(k — 1) (ver 
Eq. 3.14). Para evitar esse inconveniente 


pode-se proceder realizando a decompo- 
sição em frações parciais de 


M(2) 102 +5 A B (o; 


z (2z—1)(z—0,2)z Ri 20,2 "2. 


Determinando as constantes como dan- 
tes: 


1 15 
re Nam 

(z — D(z — 0,2)z = E 

1 7 

B= o) Su E 

(2z—1)(z—0,2)z :-0,2 (—0,8)0,2 

10 
=» Zz+5 A Do. 95. 
(2 1)(2-02)2 59 02 
Assim, tem-se 
102 +5 A B 
Mi = Z+ iz z o 


CEE Cc 


cuja transformada inversa é 


m(k) = 18,75(1)*1(k) — 43,75(0,2)"1(k) + 256(k) 
259(k) + [18,75 — 43,75(0,2)"]1(k). 


Assim, tem-se m(0) = 25+18,75-43,75 = 
Omi uso so, 
mute) = (87h = 4876/02)º] = 17, que 
coincide com o resultado obtido em exem- 
plos anteriores. 


3.2.3 Fórmula de inversão 


A transformada inversa Z pode ser calculada 
pela fórmula de inversão, que é dada pela 
análise complexa como: 


1 
m(k) = — & M(z)z" dz, (3.15) 
279 Jr 
em que j = v-1 e T é qualquer cami- 
nho fechado que inclui todos o polos fini- 
tos de M(z)z*!. Um conhecido resultado 


do famoso analista francês Augustin-Louis 
Cauchy (1789-1857) é que o resultado de 
(3.15) pode ser obtido, sem calcular a inte- 
gral, utilizando-se: 


mit = res[M (2)2*"1] (3.16) 


pol[M(2)z*-1] 


em que pol[-] indica os polos e res[:|, os resí- 
duos, sendo que estes podem ser determina- 
dos pela expressão (2.45). O uso de (3.16) é 
ilustrado no próximo exemplo. 


[=]: [m] [5] $:3 [m] 


a RS 


[m] A uu [=] uu 


Exemplo 3.2.5 


Voltamos a considerar M(z) em (3.11). 
Devemos agora calcular os resíduos de 
M(z)2*"1, portanto temos: 


10z + 15 
m= CD a e 
(2—1)(2—0,2) = O OE 
10z + 7(0,2)"(0,2)-1 
us Oz 5 Ze 1a 0,2) = ( ) ( ) 
(z—1)(z—0,2) 2=0,2 —0,8 


= —43,75(0,2)”. 


Aqui é importante notar que para o 
instante k = O a função da qual são cal- 
culados os resíduos torna-se M(z)z! = 
M(z)/z, que tem um polo a mais, agora 
em z = 0. Portanto, para k = O há um 


resíduo a mais, que é 


Eds 102 +5 se 
CE eia) Cd 


Portanto, a transformada inversa para 


k > 1 é dada por 


m(k) = ri +r2 = 18,75 — 43,75(0,2)*, (3.17) 


eparak=0,m(0)=ro+ri+ra = 25+ 
18,75 — 43,75(0,2)º = 0, o que coincide 
com resultados anteriores. Semelhante- 
mente, m(1) = 18,75 — 43,75(0,2) = 10, 
m(2) = 18,75 — 43,75(0,04) = 17, e assim 
por diante. 


3.2.4 Equação de diferença 


À fim de usar uma equação de diferenças para 
obter a transformada Z inversa de uma fun- 
ção M(z), imaginamos que essa função cor- 
responde à transformada Z de um sinal m(k) 
que é a resposta (saída) de um sistema a 
uma entrada u(k) impulsiva unitária ou seja 
u(k) = 9(k). Como, nesse caso, U(z) = 1, 
vemos que m(k) = Z!(M(JU(z)). 


Exemplo 3.2.6 


Voltamos a considerar a função racional 

(3.11). Usando uma entrada impulsiva 

temos U(z) = 1 e podemos escrever 
zo 


ic = Ut). 
(2) 2-122+0,2 (2) 


Multiplicando cruzado temos 


M(2)[22-1,22+0,2] = U(2)[102+5] 
M(2[t—1,2271 +0,2272] = U(z)[1027! + 5272] 


e tomando a transformada Z inversa com 


condições iniciais nulas: 


M(2)[1-1,2271-+0,2272] = U(z)[10271+527?] 
m(k)-1,2m(k—1)+0,2m(k—2) = 10u(k—1)+5u(k—2) 


ou, isolando, m(k) 


m(k) = 1,2m(k—1)—0,2m(k—2)+ 
+IOu(k—1)+5u(k—2). (3.18) 


Tendo encontrado a equação de diferen- 
ças, a transformada Z inversa é obtida 
resolvendo-se essa equação para entrada 
impulsiva u(k) = ó(k) com condições ini- 
ciais nulas. Portanto, tomando u(0) = 1 
em(—1) = m(—2) = 0 tem-se para k = 
O: 


m(0) = L2m(1)-0,2m(2)+10u(C1)+5u(c2) 
= 1,2(0) — 0,2(0) + 10(0) + 5(0) = 0. 


Para k = 1 e k = 2 temos, respectiva- 


m(1l) = 1,2m(0)-0,2m(=1)+10u(0)+5 u(-1) 
= 1,2(0) — 0,2(0) + 10(1) + 5(0) = 10 

m(2) = L2m(1)-0,2m(0)+10u(1)+5u(0) 
= 1,2(10) — 0,20) + 10(0) + 5(1) = 17, 


em que o valor de m(1) usado na segunda 
iteração é o resultado da primeira itera- 
ção. À sequência de números: 0,10,17,... 
é a mesma encontrada em exemplos an- 
teriores. 


Exemplo 3.2.7 


Uma das vantagens da transformada in- 
versa Z via equação de diferenças é a pos- 
sibilidade de encontrar a saída y(k) de 
uma função de transferência dada uma 
entrada qualquer. Para ver isso, supo- 
nhamos que (3.11) é a função de transfe- 


rência do sistema, ou seja, 


Y(2) 102 + 5 


DU EE 


Procedendo como no Exemplo 3.2.6 obtém- 
se: 


(e) po oo [10275252] 
e, por fim 


y(k) = 1,2y(k—1)—0,2y(k— 2) + 
+10 u(k—-D+5u(k—2). (3.19) 


Note que utilizando (3.19) é possível 
encontrar a saída y(k) para uma entrada 
qualquer, desde que se tenha o seus valo- 
res ao longo do tempo. Para iniciar uma 
simulação utilizando (3.19), além dos va- 
lores da entrada, é necessário ter duas 


condições iniciais. Por exemplo, supo- 
nhamos que desejamos conhecer a saída 
a partir do instante k = 10, a primeira 
execução de (3.19) requer os valores de 
y(9) e y(8), além dos valores da entrada. 
Na iteração seguinte, o valor recém cal- 
culado y(10) passa para o lado direito da 
equação, junto com y(9) e os valores da 
entrada para determinar y(11) e assim 
sucessivamente. 


A Tabela 3.1 apresenta alguns pares da 
transformada Z. À transformada de Laplace 
correspondente está na Tabela 2.1. 


3.3 O Mapeamento z = e!* 


Iniciamos este capítulo chamando atenção 
para o fato de que a transformada Z pode 
ser interpretada como um caso particular da 
transformada de Laplace de um sinal que foi 
amostrado de maneira ideal. Nesse procedi- 
mento foi realizada a mudança de variáveis 
2 < e?s, portanto é útil investigar algumas 
das propriedades do mapeamento 2 — e7s, o 


que é feito nesta seção. 


nem pr 
Via Fri 
Es Es 


Apesar de tanto z como s serem variáveis 
complexas, é conveniente representar s em 
coordenadas cartesianas e z em coordenadas 


polares, ouseja, s= oc +jwez= rei (ver 
Figura 3.1). 

Como visto na Seção 2.3, a função M*(s) 
é periódica com período jws, sendo ws = 21/T 
a frequência de amostragem. Mais especifi- 
camente (ver Figura 2.21), dada a simetria 
de M*(s) em torno do eixo real, basta consi- 
derar tal função na região definida por 


Op =(s=0+tjwEC|-ws/2<w<ws/2), (3.20) 


chamada faixa primária. Para saber onde Q, 
se encontra no plano z, por agora considera- 
se apenas o contorno. O limite superior é de- 
finido por 5 = o+jws/2, Yo, portanto usando 
o mapeamento z = e!s 

Nas 


Re ae RÃS w=ws/2 


= eTelin/DT — er (3.21) 


em que foi usada a relação de Euler e? = 
cos 8 + jsenf e o fato de que ws = 27/T (ver 
Exercício 3.5). À primeira constatação é que 


a reta horizontal s no plano s é mapeada 
para o eixo real negativo no plano z. Para 
9>-ocoz>5>0 eparao 500 z>5-o, 
portanto —oo < o < oo é mapeado como o 
eixo real negativo no plano z. O limite in- 
ferior da faixa primária s = o — jws/2, Vo 
é mapeado para o mesmo lugar no plano z, 
o que não é surpresa, dada a periodicidade 
da função ei7s. Seguindo o mesmo procedi- 
mento pode ser visto que o eixo real no plano 
s é mapeado para o semi-eixo real positivo no 
plano z (ver Exercício 3.6). 


Re 


o — jw x 


FiGUuRA 3.1: Representação de polos nos 
planos complexos (a) s e (b) 2. Em geral, 
pontos nos planos s e z são representado por 
s=-o+jwez= rel, respectivamente. 


Uma reta horizontal genérica sy = o + 
Jwo, Yo tal que sp E O, é mapeada para: 


c+tjw)T 
W wo 


= e a = Ao, (320) 


z= e 


que representa uma semi-reta entre a origem 
do plano z e o infinito, formando um ângulo 
de valor wo” com o semi-eixo real positivo 


(ver Figura 3.2). Portanto, valores positivos 
de w, ouseja, O < w < ws/2 = 1/T cor- 
respondem a ângulos entre 0 < wT < 7. 
Portanto, a região 


fon . 
O, =LlotjwveC|0O<w<w/2) (3.23) 


é mapeada para z = fre? E C|0<0<r), 
ou seja, para o semiplano superior no plano 
z. Pelo mesmo procedimento, percebe-se que 
a região 


Qi=fo+jveC|-w/2<w<o0) (3.24) 


é mapeada para o semiplano inferior do plano 
complexo z (ver Figura 3.2). Por fim, toda 
a faixa primária N, = NS U Q! é mapeada 
para todo o plano z (ver Exercício 3.7). De 
especial interesse é verificar para onde é ma- 
peada a região de estabilidade da faixa pri- 
mária. Esse resultado é obtido no próximo 
exemplo. 


plano s plano z 


Im Im 500 


FIGURA 3.2: Retas horizontais no plano s, 
são mapeadas para retas radiais no plano z. 


Exemplo 3.3.1 

A região do plano s que correspondo a 
comportamento assintoticamente estável 
de m*(t)LT!(M*(s)! é definida por: 


Q5 =Lo+jwvEC|-c0 <0<0, -ws/2< w<ws/2).(3.25) 


Como feito anteriormente, é conside- 


rado o seguinte mapeamento 


z=els = e!otiw) = eTeiwT =eT/wT. (3.26) 


Logo, a origem do plano s (ponto A na 
Figura 3.3) corresponde ao ponto z = 
e7º = 1 no plano z. À medida que avan- 
çamos a partir do ponto A em direção 
ao ponto B, como o = (0 nesse trecho, 
tem-se que a representação no plano z 
e SAO com NS us us Dom 
O < wT < 7 que corresponde a um se- 
micírculo de raio unitário no semiplano 
superior. 


plano s plano z 


FIGURA 3.3: Regiões de estabilidade no 
plano s, e no plano z. 


À semi-reta s = o+jws/2, —00 < 0 < 
0, como discutido anteriormente, é mape- 
ada para a semireta BC. A mudança em 
—oo no plano s de € para D corresponde, 
no plano z, à mudança de e T/x — 
(Am paras TO UA por 
tanto, no plano z os pontos Ce D na 
Figura 3.3 são coincidentes. A mudança 
de fase de 7 em C para —7 em D indica 
uma mudança de direção, é como se o 


ponto desse meia volta girando sobre si 
mesmo no ponto €, que coincide com D. 
O percurso de D para E no plano s corres- 
ponde a percorrer a semi-reta DE sobre 
o eixo real negativo no plano z, termi- 


nando no ponto z = —1 quando o = 0, 
pos 2 elZm ES Si Portim o se 
mento de reta s = jw, — ws/2<w<0 


corresponde ao semicírculo entre E e A 
no plano z. 

Até agora, o que sabemos é que o con- 
torno de Oy mapeia para a circunferên- 
cia de raio unitário. Agora, se tomarmos 
qualquer ponto dentro da região de es- 
tabilidade no plano s, ou seja, so E Vj 
temos 


2o=eT 0 =eTootiwo) =eroT/unT, (07) 


em que oo) < 0e —ws/2 < wo < ws/2. 
quina dj = 00 ee portanto, 29 


pertence ao círculo de raio unitário. A 
conclusão deste exemplo é que o semi- 
plano esquerdo da faixa primária no plano 
s é mapeada por z = e7* no círculo de 
raio unitário, no plano z, um resultado 
conhecido na área de análise de sistemas 
lineares. 


Exemplo 3.3.2 


A fim de investigar como o lugar geomé- 
trico s = 09 + jw, em que 09 é um va- 
lor constante qualquer, no plano s é ma- 
peado para o plano z pela função z = 
e”s, começamos observando ques dado o 
caráter periódico da função e7s, basta 
considerar para onde é esdo O seg- 
mento de reta s = co+jw da faixa primá- 


ria. Como se trata da faixa primária, a 


frequência está limitada a —ws/2 < w < 
ws/2 que é conveniente expressar como 
—1/T <w < m/T, lembrando que os va- 
lores extremos tanto pertencem à faixa 
primária como às secundárias consecuti- 
vas. Os segmentos de reta corresponden- 
tes que se encontram nas faixas secundá- 
rias são mapeados para o mesmo lugar 
geométrico no plano z. 

Portanto, s=co+jw, —1/T <w< 
n/T é mapeado para z = eT/wT, em 
que a fase varia entre —7 e 7. Em pala- 
vras, O lugar geométrico no plano z é um 
círculo de raio e”. Seo = 0, o círculo 
é o de raio unitário. Seo < 0,0 raio do 
círculo correspondente é menor que 1, e 
seo > 0, é maior que 1, como ilustrado 
na Figura 3.4. 


plano s 


] 
] 
1 
1 
oq, Re 
| 
1 


FIGURA 3.4: Retas verticais no plano s, 
são mapeadas para circunferências con- 
cêntricas e no plano z. 


Devemos lembrar que a parte real de 
polos no plano s determinam o tempo 
de acomodação das respectivas respostas 
temporais. Valores pequenos de o corres- 
pondem a respostas temporais mais len- 
tas. Portanto, polos próximos à circunfe- 
rência de raio unitário dão origem a mo- 
dos de resposta mais lentos. 


Exemplo 3.3.3 


Um outro lugar geométrico importante 
no plano s são as semi-retas axiais, ou 
seja, semi-retas que têm uma extremi- 
dade na origem do plano s e a outra no 
infinito. Considere um número complexo 
Gr ue das = = |/02 + w2|e'?, em que 
6 = tan !(w/o), ou seja, 


w=otanb. (3.28) 


Como visto em (3.26), 2z = eT/wT e 
substituindo (3.28) nessa relação, tem-se 


a = oito DIGO) 


sendo que tanQ é uma constante para 
qualquer semi-reta axial, pois para cada 
reta 0 tem um único valor. No caso de 
semi-retas axiais no segundo quadrante 


do plano s, o < 0 e, nesse caso, (3.29) 
indica que o módulo de z diminui expo- 
nencialmente. Além disso, no segundo 
quadrante O > 7/2etanQ < 0, portanto, 
a fase aumenta linearmente à medida que 
o — —oo. Como o módulo diminui expo- 
nencialmente e a fase aumenta, o lugar 
geométrico seria um espiral convergente 
para a origem do plano z. 

Contudo, como visto no Exemplo 3.3.2, 
somente a faixa primária do plano s pre- 
cisa ser considerada. O limite superior 
dessa faixa é a semi-reta BC na Figura 3.3 
e o limite inferior é a semi-reta DE. Es- 
ses limites estão indicados em linhas pon- 
tilhadas na Figura 3.5. Como visto no 
Exemplo 3.3.1, essas semi-retas são ma- 
peadas para a segmento de reta real ne- 
gativo entre a origem do plano z e o ponto 
z = —1. Portanto as espirais são de- 
senhadas com fase entre O e 7. Gra- 


ças à simetria conjugada, o desenho no 
plano z para valores abaixo do eixo real é 
uma imagem espelhada do que acabamos 
de constatar. Assim, a aparência final é 
como mostrada na Figura 3.5. 


plano s plano z 


Im Im 


REED RAR re (ÕES. 
NE 


FIGURA 3.5: Semi-retas axiais no plano 
s correspondentes a quociente de amorte- 
cimento constante e suas respectivas ima- 
gens no plano z. 


3.3.1 A transformação bilinear 


Ao amostrar um sinal, sua representação no 
domínio de Laplace passa a ter um número 
infinito de polos (e talvez zeros) como con- 
sequência do aparecimento de potências de 
e7s (ver Eq. 2.28). Esse inconveniente é con- 
tornado realizando a mudança de variáveis 
2 « efs, pois os infinitos polos no plano s 
(ver Figura 2.21) são mapeados para um nú- 
mero finito de polos no plano z. 


Essa mudança de variáveis tem outras con- 
sequências, como por exemplo, o limite de es- 
tabilidade deixa de ser o eixo imaginário no 
plano s para ser a circunferência de raio uni- 


tário no plano z. A razão para isso, como 
visto no início desta seção, é que o mapea- 
mento z = e7s mapeia o semiplano esquerdo 
da faixa primária do plano complexo s, no 
círculo de raio unitário, do plano complexo z. 


Em algumas aplicações pode ser interes- 
sante voltar a mapear o limite de estabilidade 
para o eixo imaginário sem recorrer ao uso 
de funções transcendentais, para não incorrer 
no problema de ter infinitos polos. Assim, 
descartamos o uso da transformação inversa 
Ss = 7 ln z. Contudo, ainda desejamos uma 
transformação que seja equivalente a ela em 
alguma medida. Uma possiblidade surge ao 
considerar a expansão de Inz em séries de 
potências: 


[6,9] 


1 qa 
lá: =: 9 á 
2n+1 Az+41 


n=0 
Zz—1 
gde 


(3.30) 


em que o resultado foi obtido truncando-se 

o somatório após o primeiro termo. (Como 

s = (1/7) ln z, escrevemos 

ar = 

lia = 

tie ne] 

conhecida como a regra do trapézio ou o mé- 

todo de discretização de Tustin. A transfor- 
mação inversa de (3.31) é 


AMT UT+u 
“= (Too QITS 


(3.31) 


(3.32) 


Tanto (3.31) como (3.32) são conhecidas como 
a transformação bilinear e sua inversa. 

Substituindo-se as variáveis s de uma fun- 
ção de transferência contínua usando (3.31) 
obtém-se um análogo discreto, cuja solução 
temporal pode ser uma aproximação aceitá- 
vel para valores suficientemente pequenos do 
período de amostragem 7. 

Uma propriedade interessante da trans- 
formação bilinear (3.32) é que ela mapeia 


o círculo de raio unitário no plano z para 
o semiplano esquerdo do plano complexo ww. 
Essa propriedade pode ser útil na aplicação 
de alguns resultados válidos para funções de 
transferência em w a funções de transferência 
em z. Um desses casos é discutido na seção 
(estabilidade) e outro na seção (resposta em 
frequência). 

A transformação bilinear pertence a uma 
classe de transformações um pouco mais ge- 
ral, que pode ser escrita como 


Z2—1 
[6 b) 
241 


(3.33) 


em que c é uma constante. A fim de anal 
sar o mapeamento em termos de frequência, 
substituímos w = wy € 2 = Tem (3.33) e 
chegamos a 

er 1 


Way — Cut 1 (3.34) 


em que w, é a frequência (valor sobre o eixo 


imaginário) no plano w. Para w = 0 0 lado 
direito de (3.34) é nulo qualquer que seja o 
valor de c. Ou seja, o mapeamento bilinear 
permite que a função em z e a função em w 
coincidam na frequência w = 0. De fato, o 
eixo imaginário no plano w e a circunferência 
de raio unitário em torno do ponto z = 1 (que 
corresponde a w = 0) são muito próximos 
(pense em termos de formato e de direção 
de crescimento de w) para valores pequenos 
de frequência e idênticos em w = 0. Agora, 
a constante c pode ser utilizada para casar 
as respostas em frequência do sistema contí- 
nuo e discreto em uma determinada frequên- 
cia we, além de w = 0. Para isso escolhe-se 
(Middleton e Goodwin, 1990, p. 116): 


Es 
c = wecot Rr (3.35) 


Um aspecto importante, explorado na Se- 
ção 4.4.3, é que a interpretação física de 


frequências sobre o eixo imaginário no plano 
wW, Um não é idêntica àquela do plano s, w. 


Exemplo 3.3.4 


Neste exemplo desejamos verificar nume- 
ricamente a transformada bilinear. Para 
isso tomamos valores de z sobre o círculo 
de raio unitário e os mapeamos para o 
plano-w usando (3.31), como visto na Fi- 
gura 3.6. 
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FIGURA 3.6: As cruzes são valores de z 
tomados sobre o círculo de raio unitário. 
Os pontos são valores da variável w cal- 


culada usando (3.31). 


A Figura 3.6 pode ser produzida com 
o código: 


% inicialização 
T=1; sigma=0; j=sgrt(-1); 
4% faixa de valores de w 
omega=0:pi/50:2xpi; 
4% para cada valor de frequência faça 
for k=1:1ength(omega) 
4% variável de Laplace 
s=sigma+j+omega(k) ; 
4% valores de z sobre a circunferência 
z(k)=exp(T+s); 
% mapeamento bilinear 
w(kK)=2*(z(K)-1)/(Tx(z(kK)+1)); 
end 


% faz o gráfico 
plot(z,º+?) 
set(gca,?FontSize”,18) 
xlabel('real?) 

ylabel(º imagº) 
axis(?square?) 

axis([-1.5 1.5 -1.5 1.5]); 
hold on 

plot(w,?.?) 

hold off 


Como pode ser visto, a transformação bi- 
linear (3.31) mapeia o círculo de raio unitário 
no plano-z sobre o eixo imaginário no plano- 
w. Fica como exercício verificar que o inte- 


rior do círculo é mapeado para o semiplano 
esquerdo do plano-w. Essa verificação pode 
ser feita numericamente adaptando o código 
fornecido neste exemplo. 


3.4 A Transformada Z 
Modificada 


Considere um sinal a(t) cuja transfor- 
mada Z unidirecional X(z) é definida em 
(3.5). Se tomarmos as transformada in- 
versa de X(z) (ver Seção 3.2) recuperaremos 
uma sequência discreta de valores, a saber 
a(0), x(T), .. .g(nT). Em outras palavras, a 
grandeza transformada X(z) contém infor- 
mação sobre os valores temporais de x(t) so- 
mente nos instantes t=nT,n =0,1,.... 


Imagine que desejemos conhecer valores 
do sinal entre os instantes de amostragem, 
tais como x(mT), v([m + 1]7),... para O < 
m < 1. Sabemos que a inversa de X(z) 
corresponde somente a x(0), 1(T), ...v(nT), 
portanto, é necessário usar uma outra função 
que, como veremos a seguir, é a transformada 
£Z modificada, que indicamos por X(z,m). 
Antes de prosseguir, procuremos imaginar 
um procedimento pelo qual consigamos obter 
os valores v(mT), v([m+1|7),.... Para faci- 
litar a argumentação suponha que m = 0,6, 
ou seja, desejamos representar a sequência de 
números 10,67), x(1,67), x(2,67).... 

Um procedimento para obter esses valores 
corresponde a atrasar o sinal de (1— 0,6)7 = 


0,47 e amostrar normalmente nos instantes 
0, T, 2T,.... Para ver isso, considere o si- 
nal contínuo x(t) original mostrado na Fi- 
gura 3.7. Imaginemos esse sinal atrasado de 
0,47: a(t — 0,47). Agora, amostremos em 
0, 7, 2T,... para obter x(—0,47), x(0,67), 
q(1,67),.... Se o sinal x(t) começar em t = 
0, então a série é (0,67), x(1,67),..., que 
são precisamente os valores desejados. 


(a) (b) 
«(Mt a(t— 0, 4T)1(t— 0,47) 


67 =mT 


A 
Eus Enio 
0 T2T3TA4T t otTr 27 


37 47 f 
047= AT 

FIGURA 3.7: Em (a) mostra-se o sinal 
a(t)1(t) e em (b), é mostrado o sinal atra- 
sado x(t — ATJI(t— AT) com À = 0,4. Note 
que os instantes de amostragem são os mes- 
mos em ambos os casos. Em (a) o resultado 
da amostragem são os valores indicados por 
círculos, e em (b), os valores indicados por 
cruzes. 


Portanto, vemos que a transformada mo- 
dificada implicitamente pode ser imaginada 
como a transformada Z de uma versão atra- 
sada do sinal original, como ilustrado a se- 
guir. 


Exemplo 3.4.1 


Seja o amall ql) E eo: 
Deseja-se representar, usando téc- 
nicas de transformada, a sequência 
En e Se a sequeis 
cia pudesse ser representada por 
erT(nT) com T E Rene zZ 
poderíamos utilizar a transformada Z. 
Como esse não é o caso, usaremos uma 
representação alternativa. 

Começamos notando que 
emas a UT a pode ser 
escrita como x(nT7 — 0,47)1(nT' — 0,47). 
Assim, escrevemos 


oo 
a(ln — 0,4]7)z” = 

n=0 
= 2(0,67)2 1+x(1,6T)z “+ x(2,6Tz +... 
a0,67,-1, 6-41,67,-2, 42,67, 3, 


=e 


oO, 6, fi+e aT,-1, p-027, 2+...] 


1 
06 go nl 
=e e ea gen OE Cel, 


(3.36) 


em que se usou o fato de que (07 — 
0,47) = 0. Como a sequência e-087, 
eU Ni oi escrita em termos 
de valores do sinal discreto x(nT) atra- 
sado de AT, com À = 0,4 e amostrado 
em nT,n € Z (Philips e Troy Nagle, 
1995, p. 142), o resultado em (3.36) é, de 
fato, X(2,0,4), ou seja, 


1 
—a0,6T ,—1 -—aT,—1 

aa a RR re 
e—40,6T eTUI-A)T 


pm = -aT 
a Sam ll e 7. (8.37) 


Uma interpretação útil é obtida no- 
tando que a sequência discreta em ques- 
tando CU indicada 
pelas cruzes na Figura 3.7, pode ser ob- 
tida atrasando o sinal z(nT) de AT, com 
A = 0,4e mantendo os instantes de amos- 
iragem em é = nh nu = 12... Nesse 
caso, a transformada da referida sequên- 
cia é X(z,0,4). 


Como visto na Seção 4.3, no caso de siste- 
mas com atraso puro de tempo para os quais: 
i) o atraso não é um múltiplo inteiro do in- 
tervalo de amostragem 7, e ii) os instantes 
de amostragem permanecem localizados em 
t=nT,n=1,2,..., é conveniente proceder 
como como no Exemplo 3.4.1. Em particular 
é possível generalizar o resultado para qual- 
quer valor do atraso A. Essa generalização 
é formalizada pelo que veio a ser conhecido 
como a transformada Z modificada, apresen- 


tada a seguir. 


3.4.1 Definição 


A transformada Z modificada com parâme- 
tro m, indicada X(z,m), de uma sequência 
de valores amostrados de um sinal x(t) pode 
ser obtida pela transformada Z do sinal atra- 
sado de AT e com 1 — m no lugar de A, ou 
seja, z(t— AT) = a(t— T + mT), em que 
0O<m <1. Matematicamente tem-se: 


X(zm) = X(gA)lsn-im= z (X(g)e STE) 


A=i-m 
=B (X(9)e (mr) (3.38) 


ou ainda 


X(z,m)= E (X(s)e Trompa) = eiz(x(s)emTol - (3.39) 


Na última expressão vemos o efeito de atra- 
sar o sinal de T (multiplicação por z 1) e 
de adiantar o sinal de mT (multiplicação de 
X(s) por e”Ts antes de amostrar e tomar a 
transformada Z). Note que essa operação é 


ilustrada na Figura 3.7. Para ver isso, ob- 
serve o primeiro círculo. No gráfico da es- 
querda, aparece no instante t = 0. Depois de 
atrasado de T e adiantado de mT, esse cír- 
culo aparece em t = (1 —-m)T = AT, como 
visto na Figura 3.7b. Portanto (ver Exercí- 
cio 3.8), 


eim !elfmA NT) + e(im+2]7)2 "+. 


Deve ser notado que a expressão em (3.40) 
usa valores do sinal x(t) qualquer em ins- 
tantes não coincidentes com os instantes de 
amostragem. Em outras palavras, a trans- 
formada inversa de X(z,m) fornece valores 
do sinal que se encontram entre instantes de 
amostragem. No exemplo da Figura 3.7a es- 
ses valores são as cruzes. 


A expressão (3.38) não é imediatamente 
útil na determinação da transformada Z mo- 
dificada, pois requer a transformada Z de 
uma função no domínio s. Como vimos an- 
teriormente, a expressão (2.44) permite ob- 
ter a transformada estrelada a partir de uma 
transformada de Laplace, o que contorna a 
dificuldade mencionada. Portanto, utilizando 
(2.44), a transformada Z modificada pode 
ser definida como 


1 


qse) 6) 


x(am) = 21 bm res [einer 
pol[X(N)] 


em que poll.| e resl.) indicam os polos e os 
respectivos resíduos da função no argumento, 
e que podem ser determinados pela expressão 
(2.45). 

Apesar de ser natural motivar o uso da 
transformada Z modificada partindo-se de 
um sinal deslocado no tempo, como feito nesta 
seção, essa transformada não pressupõe a pre- 
sença de atrasos. De fato, como indicado na 
Nota Histórica deste capítulo, a motivação 


original para a proposição da transformada 
Z modificada era conhecer os valores do sinal 
transformado entre os instantes de amostra- 
gem. 

As seguintes propriedades da transfor- 
mada Z modificada podem ser facilmente ve- 
rificadas; 
X(2,1) = «(T)z !ta(2TD)e 2 +a(3T)z SA... 
0)-a(0)+a(T)z !+e(27)272 +a(37)z +... 


X(z2,0) = «(0) 


AT) +e(27)2 ss 
= 2 [e(0)+x(T)z “Lra(2T)z 24. É 
si x(2), (3.43) 
ou ainda 


X(z) = lim zX(z,m) = lim X(z,m)(3.44) 
m>0 m51 

As relações em (3.44) mostram que 

a transformada Z é um caso particular 

da transformada Z-modificada. Em algu- 

mas situações pode ser interessante optar 


pela transformada modificada como repre- 
sentação mais geral e então avaliar o si- 
nal no tempo, via transformada inversa, 
escolhendo-se o valor de m. Contudo, ao 
fazer isso, é importante perceber que para 
sinais amostrados em t=nT,n E N, so 
mente a transformada Z é permitida — 
veja a definição (3.5). Somente para si- 
nais em tempo contínuo podemos escolher 
0O<m < 1 paraencontrar sua representação 
em temo discreto por meio da transformada 
Z-modificada. 


Exemplo 3.4.2 


A transformada Z modificada de x(t) = 
e“1(t), com “atraso” AT pode ser ob- 
tida usando (3.37) (ver a Eq. 3.39) como 


e(A-DaT a 
e EEE Deli 
Ce A=l-m 
eqmar f 
e Bee Gs) 


No enunciado deste exemplo usamos 
aspas na palavra atraso porque não ne- 
cessariamente deve haver um atraso. Na 
Seção 4.3 tratamos especificamente de 
sistemas com atraso. O uso da pala- 
vra “atraso” neste exemplo foi para me- 
lhor conectar com a maneira com que 
a transformada Z modificada foi apre- 
sentada. Uma maneira melhor de ini- 
ciar o exemplo poderia ser: seja o sinal 
a(t) = e-“1(t). Deseja-se encontrar a 
transformada X(z,m) tal que ao se vol- 
tar para o domínio do tempo se tenha a 
sequência de valores z(mT), a([m+1]T), 


g(im+2]T)... comb<m<1. 


Exemplo 3.4.3 


Repetimos o Exemplo 3.4.2, mas utili- 
zando a definição em (3.41): 


Sm" 5: e uuRais, 


pol[X(A 


em que o resíduo é dado por 


1 mTh 1 
ps TERESA 


A=-a 
= —amT 1 = —amT z 
l-z-1e-a7 z—e-9T) 
Portanto 
eTamT 
Xlsimi= 2 Ri Ti 


que coincide com o resultado obtido an- 
teriormente. 


Exemplo 3.4.4 


Neste exemplo derivamos a transformada 
£Z modificada de x(t)=t (Phillips e Troy 
Nagle, 1995, p. 144). Começamos no- 
tando que a transformada de Laplace do 


sinal é X(s) = 1/s2, portanto, usando 
(3.41) temos: 


= 1 il 
X(em) = 27! so res | E 
pol[X(N)] 


sendo que o resíduo da função em colche- 
tes pode ser obtida usando (2.45). Como 
X(s) tem um polo com multiplicidade 
igual a 2, tem-se: 


d 1 1 
—1 2 mT 
X(z2,m) = z lim ER b 3º —| 


mTemTA enc ze O 
espe (1-21eTA)2 | 
a mid -z D+Te 
= | (= 2-2 | 
mT(z-D+7T 
(e 


= 2"! lim 
A>0 


que permite determinar v(mT7), x([m + 
Mo) ee E Dra 


Exemplo 3.4.5 


A transformada Z modificada permite ex- 
pressar na forma de transformada um si- 
nal ou sistema que tenha atraso puro de 
tempo diferente de um múltiplo do in- 
tervalo de amostragem T. Por exemplo, 
seja um sistema com função de transfe- 
rência G(s)e-*os, sendo to = (k+ A)T, k 
éinteiroe0<A< 1 A transformada 
Z modificada do sistema é 


Cio = Eidos O =2feos e 
So anta ie(en 
= s"o(em). (3.47) 


que pode ser determinada a partir de G(s) 
usando (3.41). Por exemplo, seT =1e 
in Ds então G (2h 20 CO. 


Uma importante aplicação da transfor- 
mada Z modificada é a possibilidade de cal- 
cular os valores temporais entre instantes de 


amostragem (ver Exercício 3.12). Isso é ilus- 
trado numericamente no próximo exemplo. 


[m] ia [m] 
TERA 


Dear 


Exemplo 3.4.6 


A resposta ao impulso de um sistema é 
dada por h(t) = (1-e-“91(t), cuja trans- 
formada Z modificada é dada em tabelas 
e é: 


1 eTamT 


elEada) = Zz—-1 z-e a” 


(1 sn e an 
2 — (1+e “D)z+e 7 


b) 


em que T é o tempo de amostragem. 
Deseja-se encontrar a resposta ao de- 
grau unitário desse sistema nos instantes 
(mn = 0,120 supondo 02 
m=0,6eT7T=1. Para isso usamos o mé- 
todo da equação de diferenças discutido 
na Seção 3.2.4 para encontrar a transfor- 
mada inversa de H(z,m), que é a fun- 
ção de transferência do sistema e, então, 
a equação de diferenças é resolvida nu- 
mericamente para a entrada em degrau. 
Usando os símbolos x para a saída e u 
para a entrada obtém-se 


x(o)fzº — Cz+ D] = (Az + BJU(2) 
x(9)1-Cz14+Dz"2] = (42 1+Bz"9U(2), (3.48) 


cmi que A Dc 


este qi den cio 
mando a transformada inversa e conside- 


rando condições iniciais nulas chega-se a: 


a(k) = Cae(k—1)— Dx(k—2) + Au(k— 1) + Bu(k —2) (3.49) 


que é a equação de diferença que des- 
creve o sistema nos instantes desejados, 
ou seja, (Mm +n)T,n = 0,1,2,.... A 
equação (3.49) pode agora ser iterada 
normalmente, mas deve-se lembrar que 
os valores encontrados para x(1), (2), 
.. referem-se a z(m7T), z([m+ 1T),..., 
como ilustrado no seguinte código, em 
que a transformada Z clássica foi usada 
também para fins de comparação: 


T=1; ) tempo de amostragem 

m=0.6; ) parâmetro da transformada 

a=0.2; Y parâmetro do sinal em tempo contínuo 
N=15; Y número de iteradas a computar 

4% função de transferência em tempo contínuo 
num=[a]; den=conv([1 0], [1 al); 

t=0:0.01:NxT; ) vetor de tempo 

% resposta ao degrau do sistema continuo 
y=step(num,den,t); 


% coeficientes das equacões de diferenças 
A=1-exp(-a+*m+*T); 

B=exp(-a+*mxT) -exp(-axT); 

C=1+exp(-ax*T); 

D=exp(-ax*T); 

E=1-exp(-axT); 


% sinal de entrada: degrau unitário 
u-ones(1,N); 


% condicoes iniciais 
x(1)=y (m+100+1); 
x(2)=y ((m+1)+100+1); 
x2(1)=y(1); 

x2(2)=y (101); 


% simulação das equações de diferenças 

for k=3:N+1 
% da transformada Z modificada 
x(k)=C+x(k-1) -D+x(k-2)+A+u(k-1)+B+u(k-2) ; 


% da transformada Z clássica 
x2(k)=C+*x2(k-1) -D+x2(k-2)+E+u(k-1); 
end 


% vetor de tempo deslocado 
Te=m*T:T: (m+N)xT; 


% faz o gráfico 

plot(t,y,ºk?,Te,x,ºkK+,0:N,x2,ºk.º, 
'“MarkerSize?,10) 

xlabel(?tempo”) 

ylabel(ºx(nT) e x([nT+mT)?) 


Pela Figura 3.8 percebe-se que os va- 
lores calculados usando a transformada 
Z modificada, verdadeiramente correspon- 
dem ao sinal de saída nos instantes deter- 
minados. Contudo, o “relógio” implícito 
no laço for é o mesmo que o utilizado 
para a equação de diferenças relativo à 
transformada Z clássica. 


0 5 10 15 
tempo 

FIGURA 3.8: Em traço contínuo está 
a(t). Os pontos indicam ag(nT) ob- 
tido pela transformada Z inversa (clás- 
sica). As cruzes indicam v(n” + mT7) 
obtida tomando a transformada inversa 
de X(z,0,6). 


Nota Histórica 


Aparentemente, a transformação bilinear ou 
de Tustin foi publicada pela primeira vez em 
(Tustin, 1947). 


Apesar de Hurewicz haver usado a trans- 
formada Z em um capítulo publicado em 1947 
(Hurewicz, 1947), esse nome foi cunhado por 
John Ragazzini e Lotfi Zadeh em 1952 (Ra- 
gazzini e Zadeh, 1952). O primeiro livro de 
controle digital em língua inglesa foi publi- 
cado em 1958 por Ragazzini e Gene Fran- 
klin (Ragazzini e Franklin, 1958), sendo que 
seis semanas depois Eliahu Jury — que as- 
sim como Zadeh e Franklin havia sido ori- 
entado por Ragazzini — publicou o segundo 
livro em língua inglesa sobre o mesmo tema 
(Jury, 1958). Jury atribuiu a Tsypkin a au- 
toria do primeiro livro em sistemas discretos: 
Y. Z. Tsypkin, Differenzen-gleichungen der 
impulse-und regeltechnik, Berlin 1956, tradu- 


ção do original em russo publicado em 1951 
(Jury, 1981, p. 15). 


Ragazzini e Franklin apresentam a trans- 
formada Z modificada, sem utilizar essa de- 
nominação. Eles referem-se à “transformada 
Z atrasada” e à “transformada avançada” (Ra- 
gazzini e Franklin, 1958, p.65). Os auto- 
res claramente indicam que tal modificação 
foi introduzida por R. H. Barker em 1952 e 
posteriormente desenvolvida por Ragazzini e 
Jury (Ragazzini e Franklin, 1958; Jury, 1956). 


Leitura Recomendada 


Vários livros fornecem detalhes sobre a trans- 
formada Z e sua inversa. Merece destaque o 
livro de Eliahu Jury inteiramente dedicado 
à transformada Z e suas aplicações (Jury, 
1964). Com respeito à transformada Z in- 
versa, alguns resultados auxiliares relaciona- 
dos ao teorema de resíduos de Cauchy são 
apresentados em (Hemerly, 2000). Em par- 
ticular, a expressão para cálculo de resíduos 


(2.45) é derivada nesse livro. 


Exercícios 


Com respeito ao script simrk ph teste pede- 
se: 


1. encontre as equações de diferença cor- 
respondentes a modelos lineares. Obte- 
nha as correspondentes funções de trans- 
ferência. 


2. Escolha um ponto de operação diferente 
ao que foi dado — que chamamos de 
ponto de operação original — e observe 
o desempenho dos modelos lineares. O 
que ocorreu? Por quê? 


3. À partir de uma resposta ao degrau do 
processo “em tempo contínuo”, obtenha 


uma função de transferência do tipo: 


para o ponto de operação original. A 
partir de G(s), use (2.44) e (3.3) para 
encontrar uma função de transferência 
G(z). Implemente a função de trans- 
ferência encontrada na forma de uma 
equação de diferenças. Simule e com- 
pare o desempenho de seu modelo com 
aqueles fornecidos no script. 


3.1. Encontre a transformada Z de 
m(n7)=1(n7-T) e dem(nT)=1(n7 — 47). 


3.2. Determine os primeiros 6 valores de 
m(k) correspondentes às seguintes expressões: 


(z— D(z— 29(z2—3) 


a) M(2) = 


102+5 


b) M(Z) = 


(z — D(z — 0,2) 
e Mij= ae) q==|LT=l 
(asia) 
82 — 19 
VM oa) 
2(22º — 112 +12) 
O DOR 
DR 22(32 + 17) 


(z— 1)(22 — 62 +25) 


utilizando os seguintes métodos: 1) frações 
parciais, ii) divisão polinomial, iii) algoritmo 
usando equação de diferenças, e iv) método 
dos resíduos. Encontre uma expressão fe- 
chada para m(n) em cada caso. 


3.3. Seja M(z) = z/(az +b). Encontre uma 
expressão para m(k) usando o método dos re- 
síduos. Usando a expressão determine m(0), 


m(1) e m(2). Confirme esses valores usando 
divisão polinomial. 


3.4. Com base no Exemplo 3.1.2 (veja Exer- 
cício 2.12) procure estabelecer uma relação 
entre os polos de M(z) e os de M(s). Essa 
relação é também válida para os zeros? 


3.5. Comprove a veracidade de (3.21). 

3.6. Mostre que o eixo real do plano s, ou 
seja, s = 0, Vo E R é mapeado por 2 = e?s 
para o semi-eixo real positivo no plano z. 
3.7. Mostre que cada faixa secundária de 
M*(s) do plano complexo s é mapeada por 


z = e?s para todo o plano 2. 


3.8. Mostre que: 


Ea A e E p= >iz(nr-[1-m]T)z?. 


3.9. Uma pessoa tem hoje com o banco uma 
dívida de R$Do. A evolução anual dessa 
dívida é descrita pelo modelo (Luenberger, 
1979, p. 22): 


—D?-(B+Doz 
laje (2 -a)lz-1) 


sendo i a taxa de juros anual cobrada pelo 
banco e B o valor fixo por ano pago para 
amortizar a dívida. Com respeito a esse mo- 
delo pede-se: (a) mostre que Do é, de fato, 
a dívida inicial; (b) encontre uma expressão 
fechada que descreva a evolução da dívida ao 
longo do tempo; (c) qual deve ser o valor fixo 
B a ser pago por ano, a fim de saldar a dívida 
em N > 0 anos? 


,a=1l+1, 


3.10. Use a decomposição em frações parciais 
para encontrar a transformada inversa de: 


e de O 
(z— D(22—- 2 +11). 


M(z) = 


3.11. Use o método dos resíduos para encon- 
trar a transformada inversa de: 


22 


(z — D2(z — e-i7) 


M(z) = 


3.12. Tome a transformada inversa de (3.45) 
e mostre que corresponde à sequência de va- 
lores z(m7), x([m + 17), z([m + 2]7),.... 
Dica: faça a divisão longa (polinomial) 1/(z— 
e-“7) e depois multiplique por ema”, 

3.13. Implemente um programa de compu- 
tador que itere a equação de diferença cor- 
respondente ao lado direito do item 14 na 
Tabela 3.2. Ou seja, implemente a transfor- 
mada Z modificada inversa para esse caso. 
Confirme seu resultado usando o lado esquerdo 
da tabela. 


3.14. Considere o sistema mostrado na Fi- 
gura 3.9. Derive a representação de G(s) no 


domínio z. Verifique por simulação a equiva- 
lência da simulação em s e em z. 


FIGURA 3.9: Sistema em tempo contínuo 
com atraso puro de tempo. 


item função m(nT) M(z) = ZimnT)) 
T S(nT) T 


z 
2 1(nT) 
z-—1 
Tz 
3 nT EE 
G-12 
T2z(z +1 
4 0,5(nT)? ade ) 
a(z — 1)3 
z 
5 emanT 
(E esEs 
-aT 
6 nTe MT Fãere 
(2 — e-aT)2 
or z 
7 (nT)FeTenT ( n* 
dat |(z- e-aT) 
8 1-e-aT E epa 
(2— De e-e7) 
“MA emanT el(aT=e “Ty H1-e 27 aTe-“T)] 
9 nT-(1-e )/a GO 
-aT —bT 
10 ecmT — bnT z(e 0" — e ) 
(z — e-aT)(z — ebT3 
zsenaT 
11 senanT ultimo DES PS OO a 
z2 -— (2cosaT)z+1 
12 cosanT osftersecos ad) + 
z2 — (2cosaT)z + 1 
“anT 1 ze “TsenbT 
13 (eTeNT sen bnT)/b es 
bz2-22e74T cosbT + e—24T 
2 —aT 
14 eMT cosbnT zº — ze “º cosbT 


z2-92ze74T cosbT + e 24T 


TABELA 3.1: Pares de transformada Z, n>0. 


item função r(nT) X(z,m) = Z(e([n+m — 1T)) 


1 S(nT) 0 
1 
2 1(nT) 
2. = 4 
3 T mT E T 
n E A 
E-D' E? 
' TA T2 [ m? pêm+i 2 
5(n 
' 2 [2-1 (2-1)2 (2-1) 
eTamT 
5 eTanT 
(z —-e-aT) 
ê nene Ter ÂmT [e-aT 4 m(z — e-ºT)] 
(z — emaT)2 
or emamT 
7 nT kemanT 1 k 
te) (3) dak |(z—- e-aT) 
1 emamT 
8 die 28 sedes = 
2 — 4 z— e-aT 
E 
9 nT-(1- erTy ja T E: amT-—1 er 
(2—1)2 a(z—1) a(z—esT) 
EA ar —bmT 
10 emmT — e-bnT ESa me Te 
z- ear Bise-bT. 
1 ein zsenamT + sen(l — m)aT 
z2 — (2cosaT)z +1 
15 7 zcosamT — cos(l — mjaT 
cos an 
z2 — (2cosaT)z+1 
13 (en T sen bnT)/b ecemT senbmT+e “Tsen(1—m)bT] 
b(z2-2ze—2T cosbT pe-—24T) 
já “anT inT eTemT [> cosbmT+e “Tsen(1—m)bT] 
e cos bn 


22-2ze74T cosbT+e-24T 


TABELA 3.2: Pares de transformada Z mo- 
dificada, n > 0. Essa transformada pode ser 


A a ado ar 4r 


Capítulo 4 


Sistemas 
Amostrados em 


Malha Aberta 


Ao longo dos capítulos anteriores desenvol- 
vemos ferramentas para descrever sistemas 
amostrados. No presente capítulo prossegui- 
mos com o mesmo alvo. Para resumir o ponto 


em que estamos, e estabelecer novos objeti- 
vos, considere o diagrama de blocos mostrado 
na Figura 4.1. 


M(s), M*(s) H(5) M(s) Gols) C(s) 


FIGURA 4.1: Diagrama de blocos de um sis- 
tema amostrado em malha aberta. M(s) é a 
transformada de Laplace de um sinal. 


No Capítulo 2 foi investigado o procedi- 
mento de amostragem, ou seja, o mecanismo 
pelo qual um sinal suave m(t) pode ser trans- 
formado em um outro sinal m*(t), que só é 
diferente de zero em instantes regularmente 
espaçados no tempo. Tanto a amostragem 
ideal como a não ideal foram consideradas. 
O teorema da amostragem (ver Seção 2.2.1) 
estabelece a menor taxa de amostragem ne- 
cessária para que o sinal de banda limitada 


m(t) seja univocamente recuperado a partir 
do sinal m*(t). Logo, se as condições do teo- 
rema da amostragem forem satisfeitas, existe 
um interpolador ideal que, operando sobre 
m(t), retorna o sinal original m(t). Como o 
interpolador ideal é um sistema não causal, 
ele não é usado em problemas de controle. 
Uma alternativa prática é o uso de interpola- 
dores causais. Um desses interpoladores, que 
é indicado por H(s) na Figura 4.1, recebe 
m*(t) e apresenta à saída um sinal interpo- 
lado m(t) que não é idêntico ao sinal original 
m(t). Aspectos dessa aproximação nos do- 
mínios de tempo e frequência para o interpo- 
lador de ordem zero foram discutidos na Se- 
ção 2.2. De posse da representação do sinal 
interpolado M(s), a resposta C(s) de uma 
“planta” com função de tranferência Gp(s) 
excitada por M(s) pode ser encontrada utili- 
zando a teoria de sistema lineares em tempo 
contínuo. 


No presente capítulo desejamos dar al- 
guns passos a mais na representação de siste- 
mas amostrados de controle. Para isso pas- 
samos a considerar o diagrama de blocos da 
Figura 4.2, que é uma versão levemente mo- 
dificada daquele da Figura 4.1. 


FIGURA 4.2: Diagrama de blocos de um sis- 
tema amostrado em malha aberta. M(z) é 
interpretado como sendo a ação de controle 
e C(z) é a transformada Z da variável con- 
trolada. 


Uma diferença sutil, porém importante, 
diz respeito à interpretação do sinal M*(s). 


No diagrama de blocos da Figura 4.1, bem 
como ao longo do Capítulo 2, M*(s) é a re- 
presentação no domínio de Laplace de um 
sinal amostrado de maneira ideal. As dis- 
cussões no Capítulo 2 foram no sentido de 
encontrar representações para tal sinal e dis- 
cutir os aspectos referentes à amostragem e 
reconstrução. No presente capítulo, o sinal 
M*(s) é considerado como sendo a saída de 
um controlador, ou seja, uma ação de con- 
trole. Como se supõe que o controlador é de 
tempo discreto, a ação de controle pode ser 
indicada como m(nT), m(k) ou M(z), nos 
domínios do tempo, de amostras e z, respec- 
tivamente. 


Do ponto de vista do controlador, o 
“sistema” a ser acionado é a combinação 
interpolador-planta, que na Figura 4.2 está 
indicada por uma caixa tracejada, com fun- 
ção de transferência G(s). Como o obje- 
tivo final é fechar a malha, a variável contro- 


lada c(t) deve ser amostrada, resultando em 
c(nT). Esse sinal amostrado, ao ser ser com- 
parado com a referência resulta em um sinal 
de erro de acionamento, a partir do qual a lei 
de controle determina ação m(nT). 
Aproveita-se para rever alguns conceitos 
sobre funções de transferência, que são vá- 
lidos tanto no domínio s como no domínio 
z, mas para fins de discussão consideraremos 
o domínio z. Uma função de transferência 
G(z), grosso modo, descreve como um sinal 
na entrada é “transferido” para a saída. Ge- 
ralmente descrevemos funções de transferên- 
cia como a razão entre dois polinômios: 
ct = Ne(z) 
De(z) 
bm” +bmaaT+..+byz+do 
Ant" Hana +...+aztao 
m <n, an + O. (4.1) 


Os m valores finitos de z para os quais 


Ne(z) = 0 são chamados de zeros de G(z), 
e os n valores de z para os quais De(z) = 0 
são os polos. A função G(z) tem ordem ne o 
grau relativo én—m. Por fim, o tipo de G(z) 
é igual ao número de raízes que De(z) = 0 
tem em z = 1,ou s= (no caso em tempo 
contínuo. 


Neste capítulo começamos estudando a 
amostragem do sinal de saída c(t). Em par- 
ticular desejamos descrever C*(s) em termos 
de outras variáveis “estreladas” no sistema, 
isso é visto na Seção 4.1. O problema a ser in- 
vestigado na Seção 4.2 é o efeito da presença 
de amostradores em uma malha de controle. 
A análise de sistemas com atraso de tempo 
é considerado na Seção 4.3 e alguns aspectos 
sobre a resposta em frequência de sistemas 
amostrados são estudados na Seção 4.4. 


4.1 Amostragem do Sinal 
de Saída 


Na análise de sistemas amostrados, especi- 
almente quando houver realimentação, é ne- 
cessário amostrar o sinal de saída, que é um 
sinal contínuo e suave. O objetivo desta se- 
ção é mostrar que há regras simples que de- 
vem ser usadas nesse caso. Com respeito ao 
diagrama de blocos mostrado na Figura 4.2, 
desejamos verificar as seguintes relações: 


C(s) = G(s)M*(s) 
C*(s) = G*(S)M*(s), (4.2) 


sendo que C*(s) é a transformada de La- 
place de c*(t) que é o sinal de saída de G(s) 
amostrado de maneira ideal, ou seja, c*(t) = 
LO (s) * Ar(s)h. 

Antes de demonstrar formalmente o re- 
sultado em (4.2), desejamos argumentar de 


maneira mais conceitual, em termos da trans- 
formada de Fourier, que a expressão (4.2) é 
correta. 


Começamos escrevendo a seguinte expres- 
são no domínio de frequência: C(jw) = 
G(jw)M*(jw), em que somente M*(jw) é 
periódica na frequência (ver Figura 4.3b). 
G(jw) não é periódica e assumimos que sua 
banda de passagem é bem menor que a 
frequência de amostragem ws (ver Exercí- 
cio 4.1). Nesse caso, C(jw) corresponde ape- 
nas à parcela de M*(jw) na faixa de frequên- 
cias em que |[G(jw)| não é desprezível. 


Se o sinal de saída c(t) = FHMC(gw)) 
for amostrado com ws, C*(jw) será perió- 
dico, com período ws. Agora, se em vez de 
G(jw) usarmos uma versão periódica G*(jw), 
a saída, que é o produto G*(jw)M*(jw), será 
periódica e, de fato, corresponde a C*(jw), 
como indicado por (4.2). 


(a) 


FIGURA 4.3: Representação esquemática 
das transformadas de Fourier usadas na re- 
lação C(jw) = G(jw)M*(jw). C(jw) não é 
periódica, apesar de M*(jw) o ser. wc indica 
a frequência de canto de G(jw. 


A seguir deduzimos a relação dada por 
(4.2). Começamos utilizando o resultado mos- 
trado em (2.37) para representar C*(s) como: 


C'(s) = - SO c(s+ nu), (43) 


n——o0 


em que o sinal negativo dentro do argumento 
de C(:) foi trocado para o sinal positivo, por 
conveniência. Como o n assume tanto valores 


negativos como positivos, essa mudança não 
altera a equação. A seguir, usando o fato de 
que C(s) = G(s)M*(s), a Eq. 4.3 pode ser 
reescrita como 

C*(s) = a E G(s + jnws) M* (s + jnws), (4.4) 


e, pelo fato de M*(s) ser periódica, tem-se: 


oo 


C*(s) = E G(s+jnws)| M*(s) 
Tr 


= G'(S)M*(9), (4.5) 
em que a expressão (4.3) foi aplicada à par- 
cela entre colchetes. À Eq. 4.5, que é igual à 
Eq. 4.2, pode ser reescrita como 

C(z) = G()M(), (4.6) 
fazendo-se a mudança de variáveis z — e?'s. 
Esse resultado, que é geral, é normalmente 
obtido escrevendo: 


A(s) = B(s)F*(s) (4.7) 
A*(s) [B(s) F*(s)]" = B*(s)F*(s) 
A(S) = BOF(S). (4.8) 


Do lado direito de (4.7) tem-se o produto 
de duas transformadas de Laplace. De ma- 
neira geral em problemas de controle de sis- 
temas amostrados, as parcelas do lado direito 
de (4.7) tem aspectos diferentes: uma, indi- 
cada por B(s), é uma razão de polinômios em 
se a outra, indicada por F*(s), é uma fun- 
ção transcendental, indicado pelo asterisco. 
Ao tomarmos a transformada Z, os termos 
transcendentais são substituídos por z e po- 
tências dessa variável. (Como consequência 
temos o produto de duas funções em z como 
visto na Eq. 4.8 expressas como a divisão de 
polinômios em z. Essas ideias são ilustradas 
no próximo exemplo. 


Exemplo 4.1.1 


Desejamos usar (4.8) para encontrar a 


transformada Z de 


3-—-3e-Ts 
A = >——. 4.9 
(5) s(s + 2) E 
Para isso, reescrevemos (4.9) como 
A(s)= É (1-e"º), (4.10) 
sem 
Ne 
B(s)  FW(s) 


que está expresso na forma de (4.7). Das 
tabelas de transformada de Laplace e Z 
— ver linha 8 —, tem-se: 

3 (11-27) 


B=57 Dep (4) 


e lembrando que F(z) = F*(s)| 
(ver Eq. 3.3), tem-se: 


z-1 


F(2) = (1 E es] =1-21= É". (412) 


z=eT's 


Por fim, substituindo as transforma- 
das em (4.11) e (4.12) em (4.8), chega-se 
ao resultado 


3 l-e?W) z-1 
ai 2(z—1)(z—-e27) 2 
= (=) 
2(2—-e-27)' 


que é a transformada Z correspondente 
a (4.9). 


Exemplo 4.1.2 


Consideramos o sistema amostrado indi- 


cado na Figura 4.4. Desejamos encon- 
trar uma expressão para os valores da 
saída c(t) nos instantes de amostragem 
nT,n = 0,1,... no caso em que m(t) é 
um degrau unitário. 


M(s)y 
El 


FIGURA 4.4: Diagrama de blocos do sis- 
tema considerado no Exemplo 4.1.2. Os 
instantes de amostragem são nT, n = 
0,1,..., em que Té o intervalo de amos- 
tragem. 


A saída do sistema é um sinal con- 
tínuo c(t). Como só interessa conhecer 
esse sinal nos instantes de amostragem, 
podemos optar por trabalhar com c*(t) 
ou c(nT), pois tais sinais têm a informa- 


ção requerida. Incluímos um amostra- 
dor fictício, mostrado na Figura 4.4. O 
mesmo indica que, caso o sinal c(t) fosse 
amostrado, então seria possível encontrar 
sinais e funções tais como c*(t), c(nT) ou 
Cr 

Começamos obtendo uma expressão 
para C(s) e a partir dela procuramos en- 
contrar C(z), que sabemos ser igual a 
C*(s), a menos de uma mudança de va- 
riáveis. Logo, 


dedo 3 


Ce) s (s+2) 


M*(s). (4.13) 


No Exemplo 2.3.1 encontramos a expres- 
são M*(s) para o degrau unitário (ver 
Eq. 2.32). Assim, podemos escrever 


“Ts 3 4! 
Cs [= | Trote (4.14) 


O resultado do Exemplo 4.1.1 fornece 


a transformada Z da parcela entre col- 
Ts 


chetes e, substituindo z = e”* no termo 
fora dos colchetes, chega-se a 
Sen) 


RcEis 2(2z-e2D 2-1 
Da tabela de transformada Z obte- 
mos o resultado desejado 


Un = (= 2),n=0,1,2.... 


Note que a resposta ao degrau unitá- 
rio do sistema amostrado da Figura 4.4 é 
idêntica à resposta ao degrau da versão 
discreta de apenas o último bloco — ou 
seja, é como se o interpolador não influ- 
enciasse — (ver Exercício 4.5). 


4.2 Diagrama de Blocos 


Nesta seção constatamos que a análise de di- 
agrama de blocos para sistemas amostrados 
requer cuidados especiais. No início da Se- 
ção 4.1 foi investigado o caso representado 
na Figura 4.5a, tendo visto que uma versão 
amostrada do sinal de saída pode ser descrita 


como C*(s) = G*(s)M*(s). 


m(t) MOS M(s) EE — M *(. 
C(s) = G(s)M(s) 


FIGURA 4.5: Diagrama de blocos de duas 
situações distintas. O caso em (a) foi inves- 
tigado na Seção 4.1 e o caso (b) é investigado 
na presente seção. Os amostradores operam 
com período de amostragem 7. 


Considere o caso ilustrado na Figura 4.5b. 


Para esse caso escrevemos: 
C(s) = G(sS)M(s), (4.15) 


em vez de (4.2), ou seja, assume-se agora que 


a entrada é um sinal suave e não a saída de 
um amostrador ideal. Como anteriormente, 


deseja-se uma expressão para C*(s). Proce- 
dendo como na Seção 4.1, escrevemos: 


C*(5) = 7 >; C(stjnws), 


n=-—00 


=: » G(stjnws) M (s+tjnws). (4.16) 
Ao contrário do que acontece em (4.4) 
onde aparece a função periódica M*(s), em 
(4.16) o que se tem é a função M(s), que não 
é periódica. Portanto, não se consegue dar 
o mesmo passo que foi dado para chegar-se 
à Eg.4.5. Está claro que o lado direito de 
(4.16) é transformada estrelada do produto 
de G(s) e M(s), ou seja, 


C*(s) = GM'*(s). (4.17) 


O ponto fundamental é notar que 
G(S)M*(s) £ GM*(s) e que tais expres- 
sões correspondem a situações físicas distin- 
tas. Como visto na Seção 4.1, C*(s) = 
G*(s)M*(s) é a transformada de Laplace 
da saída de um sistema contínuo cuja en- 
trada é um sinal amostrado (pulsado, ver 
Figura 4.5). À situação descrita nesta se- 
ção corresponde a C*(s) = GM *(s), em que 
C*(s) é a transformada de Laplace da saída 
de um sistema contínuo cuja entrada é um si- 
nal suave, ou seja, não amostrado, como visto 
na Figura 4.5b. Portanto, as saídas dos dois 
casos ilustrados na Figura 4.5 são, de fato, 
diferentes. 


O resultado descrito no parágrafo acima 
tem influência direta na análise de diagramas 
de blocos. Considere o sistema mostrado na 
Figura 4.6a. Para esse sistema pode-se escre- 


ver: 


n— 


a sm 


= 


= 


q — 


= 


UM a(o | X(5)/ X*(5) E pele 


FIGURA 4.6: Diagrama de blocos: (a) com e 
(b) sem amostrador entre os blocos. Em (a) 
é possível expressar C(z) como o produto de 
duas transformadas, em (b) isso não é pos- 
sível. Os amostradores operam com período 
de amostragem 7. 


Por outro lado, para o sistema mostrado 


na Figura 4.6b escreve-se 


C(s) = Go(s)X(s) 
= Go(s)[Gi(s)M*(s)] 
C(s) = [Gas)Gi(s)M*(s)]” 


| 
Q 
e 
o 
E 


(4.19) 


A diferença fundamental entre os dois sis- 
temas ilustrados na Figura 4.6 é a falta do 
amostrador entre os blocos (no caso (b)) com 
funções de transferência Gi(s) e Ga(s). À 
consequência disso é que no domínio amos- 
trado (ou discreto) deve-se trabalhar com a 
associação desses blocos, não com cada um 
individualmente. Note que para o sistema 
sem o amostrador entre os blocos, o subsis- 
tema Gs(s) recebe um sinal suave na entrada, 
não um sinal amostrado. 

Consideremos apenas o último bloco dos 
sistemas mostrados na Figura 4.6. O que se 


tem dito é que em ambos os casos é pos- 
sível escrever a transformada Z da saída. 
Para o caso com amostrador entre os blo- 
cos tem-se C(z) = Go(2)X (2), e para o caso 
sem amostrador, C(z) = G5X(z). No se- 
gundo caso, apesar de existir, a transformada 
C(z) não pode ser expressa como o produto 
de duas outras transformadas Ga(2) e X(2), 
como ocorre para o primeiro caso. Quando 
C(z) = Go(2)X(z), a saída foi produzida 
por valores da entrada somente nos instan- 
tes de amostragem, ou seja, apenas os valores 
a(nT),n € Z excitaram o sistema, ao passo 
que para o caso em que C(z) = GoX(z), a 
saída é a resposta à entrada x(t), Vt. 


Exemplo 4.2.1 


Considere a Figura 4.6 e a discussão re- 
alizada logo após a Eqg.3.44. Deseja-se 


expressar (4.18) e (4.19) usando a trans- 
formada Z modificada. 

No caso do sistema mostrado na Fi- 
gura 4.6a, como a entrada do bloco Ga(s) 
já está amostrado por um amostrador fí- 
sico, a entrada desse bloco é represen- 
tada como X(2)=Gi(2)M (2). Por outro 
lado, a saída do bloco Gs(s) é um sinal 
de tempo contínuo, sendo que o amos- 
trador que aparece na figura é fictício, 
portanto podemos imaginar que o mesmo 
opere com período T, mas fechando em 
instante mT, (m+DT, (m+2)7.... Por- 
tanto, podemos representar Ga(s) e sua 
saída em termos da transformada Z mo- 
dificada. O jargão é “a transformada Z 
modificada” de (4.18) é: 


Clem) = Go(z,m)Gi(2)M (44.20) 


O resultado (4.18) é um caso particular 


de (4.20), veja (3.44). 

O que muda para o sistema mostrado 
na Figura 4.6b é que o sinal amostrado 
“fisicamente” é a entrada do conjunto 
Gi(s)Go(s). Portanto, neste caso tem-se: 


Clz,m)=GiGs(z, m)M(z). (4.21) 


Exemplo 4.2.2 


Considere a Figura 4.6, com os seguintes 
valores para as funções de transferência 
dos blocos indicados: 


a 1 
Gill o e Col 


Pela tabela de transformadas, essas 
funções de transferência podem ser repre- 


sentadas usando a transformada Z como 


Ce Pe elo + 


RN 


mi 


Para o sistema na Figura 4.6a pode- 
mos então escrever 


C(z) nz" 


mo “dei Fc 


Deve ser notado que esse resultado 
somente é válido para o sistema na Fi- 
gura 4.6a, mas está incorreto para o sis- 
tema na Figura 4.6b. Para esse sistema, 
precisamos considerar Gi(s)G>(s) como 
uma única função de transferência devido 
à ausência do amostrador entre eles. Fe- 
lizmente, encontramos esse resultado di- 
retamente da tabela: 


2(1— emoT) 
(2 — D)(z — ema)! 


que é a função de transferência de pulsos 
para o sistema da Figura 4.6b. O pró- 
ximo exemplo também trata da função 
de transferência de pulsos. 


Exemplo 4.2.3 


O ramo direto de um sistema amostrado 
de controle pode ser representado pela 
parte superior do diagrama da Figura 4.7. 
Deseja-se encontrar uma expressão para 


a saída C(z). 


E(s) Mt! D/A |M(s) C(s) 

e(t) doe e(nT) o m(nT) | M*(s) n(t) | do, 
(2) Page ça 
ae 


FIGURA 4.7: Diagrama em blocos de sis- 
tema em malha aberta do Exemplo 4.2.3, 
em que se assume que nos conversores 
A/D e D/A existem amostradores ideais. 
Em um sistema de controle em malha fe- 
chada, o primeiro conversor A/D normal- 
mente não existe, pois a referência e o 
ponto de soma normalmente ocorrem em 
ambiente digital. 


Os conversores A/D sem codificador 
são representados por amostradores ide- 
ais e o conversor D/A é representado por 
outro amostrador ideal seguido de um se- 


gurador de ordem zero (ZOH). Portanto, 
as seguintes expressões podem ser escri- 
tas para esse sistema: 


Mia — DijE(a) 
M*(s) = D*(s)E*(s) 
o E —— M*(8) 
C(s) = Gy(s)M(5) 


Substituindo a expressão de M(s) em C(s), 
chega-se a 


Ji= —Ts 


C(s)=Gp(s) M*(s) = G(s)M*(s). 


Substituindo a expressão de M*(s) na úl- 
tima expressão e, a seguir, tomando a 


transformada Z resulta em 


C(s) = Gols) E D*(S)E*(9) 
ia 
Com E (Gols) E DE) 
EE [Golo] E -) D(E(2) 
Cl le Ea 


emique Diz = Ds)» e Bt) —- 
E*(s)l.-ers (ver Eq.3.3), e G(z) é co- 
nhecida como a função de transferência 
de pulsos (do inglês pulse transfer func- 
tion). Veja o Exercício 4.7. Note que 
a função de transferência de pulsos, que 
inclui a planta e o interpolador, caracte- 
riza como a entrada pulsada é transferida 
para a saída da planta nos instantes de 
amostragem. 


Em sinais e especialmente sistemas de con- 
trole, uma informação que muitas vezes é im- 
portante conhecer é o valor de um sinal à me- 
dida que t > o0. No caso de sistemas, por 
exemplo como o da da Figura 4.7, normal- 
mente se deseja conhecer o valor de sua saída 
em regime permanente ou estado estacioná- 
rio, ou seja c(t), t — oo. Sabe-se que, no 
domínio de frequência, o limite de estado es- 
tacionário corresponde a w — 0. Semelhan- 
temente, o correspondente de t — oo no do- 
mínio de Laplace é s —» 0. Como z = e?*, o 
limite correspondente no domínio z é z > 1. 


Portanto, o ganho cc ou ganho em frequên- 
cia zero de uma função de transferência G(z) 
é simplesmente: 


ganho cc= G(2z)|,., = G(1). (4.22) 


Exemplo 4.2.4 


O resultado em (4.22) é aqui obtido de 
outra forma. O ganho cc de um sistema 
linear assintoticamente estável pode ser 
calculado da seguinte maneira. Com o 
sistema inicialmente em repouso, aplica- 
se a entrada degrau unitário. Espera-se 
a saída do sistema atingir estado estaci- 
onário, o que está garantido para siste- 
mas assintoticamente estáveis. O valor 
da saída em regime permanente é igual 
ao ganho cc. Matematicamente, tem-se: 


em que z/(z — 1) é a transformada Z do 
degrau unitário. Pela descrição acima, o 
ganho cc é o valor em regime permanente 
de c(nT). Esse valor é dado pelo teorema 
do valor final, para os casos em que c(nT) 


converge a um valor finito. Portanto: 


ganho cc = lim c(nT) = lim (z — 1)C(z) 
n> 00 Z— 


lim (z DG()+ = lim G(2)z = G(1). 


aid 


4.3 Sistemas com Atraso 
de Tempo 


Seja o sistema indicado na Figura 4.8. 


FiGURA 4.8: Sistema com atraso puro de 
tempo to = (k + A)JT, sendo k inteiro. 


Graças à presença do amostrador ideal, 
como visto na Seção 4.2, a transformada Z 
da saída pode ser expressa como o produto 
de duas transformadas. Contudo, devido à 
presença de um atraso que não é um múl- 
tiplo inteiro do tempo de amostragem T, a 
transformada Z modificada, apresentada na 
Seção 3.4, deve ser usada para esse fim Isso 


é visto com mais detalhes a seguir. 


Como há um amostrador na entrada de 
G(s) presume-se que essa função de trans- 


ferência inclui o interpolador. Além disso, 
como não há um amostrador entre G(s) e 


o atraso e *º, seguindo os desenvolvimentos 
da Seção 4.2, pode-se escrever (ver Exem- 
plo 3.4.5) 


C(z) = ZHG(s)e toSIM(2) = Z(G(s)e *Tse- AT M(2) 
= zFztG(s)e UmTaM(z) 
= sola mM(Z = GalOM(. (4.23) 


Portanto, se o atraso puro de tempo for me- 
nor que o período de amostragem, ou seja, se 
to = AT, tem-se que C(2z) = G(z,m)M(2), 
em que, por definição m = 1-—- A. Esse 
procedimento é útil, por exemplo, quando o 
tempo de processamento não pode ser des- 
prezado. Uma outra situação em que deve-se 
usar a transformada Z modificada é descrito 
na Sec. 4.3.1. 


Exemplo 4.3.1 


Seja o segurador de ordem zero que opera 
com um atraso puro de tempo de A, cuja 


resposta ao impulso é mostrada na Fi- 
gura 4.9. Desejamos obter a função de 
transferência desse dispositivo. 


FIGURA 4.9: Resposta ao impulso de um 
Z0H com atraso h. 


O sinal mostrado na Figura 4.9 
pode ser descrito matematicamente como 
(compare com o desenvolvimento da Se- 
Rio) 


hralt) = 1t-h)=1(t-h-T). (4.24) 


À transformada de Laplace de h,a(t) 
é, por definição, a função de transferên- 


cia, portanto: 


Ee Lhe Lo Un DI 


—hs —(h+T)s le TE 
= É É spot É ) (4.25) 
s 


s s 


que, como esperado, é igual à função de 
transferência do ZOH (ver Eq. 2.18) mul- 
tiplicada pela exponencial complexa cor- 
respondente ao atraso. 


4.3.1  Amostradores assíncronos 


Ao longo deste livro temos considerado sis- 
temas amostrados. Para facilitar a repre- 
sentação matemática, temos considerado que 
a amostragem é realizada por amostradores 
ideias, em cuja saída há sinais “estrelados”, 
que são compostos por uma série de impul- 
sos cujos pesos correspondem aos valores do 
sinal sendo amostrado nos instantes de amos- 
tragem nT,n = 0,1,2.... O efeito de amos- 


tradores não ideais, cuja saída é constituída 
de um conjunto de pulsos de duração finita, 
foi discutido na Seção 2.1.2. 


Nesta seção desejamos considerar outro 
aspecto que dificulta um pouco a análise, mas 
que felizmente pode ser descrito com as fer- 
ramentas até aqui desenvolvidas. Ainda é 
considerado que os amostradores envolvidos 
são ideais, ou seja, a sua saída é um trem 
de impulsos. Contudo, desejamos descrever 
o cenário em que um amostrador ideal amos- 
tra o sinal de entrada nos instantes n7, n = 
0,1,2..., ao passo que outro amostra o sinal 
nos instantes AT, (h+ DT, (h+2)T,...,0< 
h < 1. Em outras palavras, apesar de am- 
bos amostrados usarem o mesmo intervalo de 
amostragem T, o segundo está atrasado de 
hT com respeito ao primeiro. 


Sistemas em que o intervalo de amostra- 
gem não é o mesmo para todos os amostra- 
dores são denominados sistemas multi-taxa e 


não são tratados neste livro. A seguir mos- 
traremos como é possível descrever sistemas 
mono-taxa mas com amostradores assíncro- 
nos. 


Exemplo 4.3.2 


Seja o sistema ilustrado na Figura 4.10, 
em que o amostrador ideal com inter- 
valo de amostragem T, amostra o si- 
nal nos instantes de tempo definidos por: 
aba DR Pa a 
1. Portanto, a entrada do ZOH é um 
trem de impulsos localizados em hT, (h + 
DT, (h+2)T,... com pesos z(hT), x([h+ 
NT), o([h +2]7),.... Desejamos escrever 
uma expressão matemática para X(s) 
mostrado na Figura 4.10b. 

O sinal interpolado (Figura 4.10b) 
pode ser descrito matematicamente 
como: 


3) ehTs e (h+)Ts 
X(s)=a(hT) k 
o) s 
—(h+1)T's —(h+2)T's 
parem | E [+ 
s s 


= —Ts 
a(o tra E] + 
s 


1-e-Ts 
+a(T+hT)e MHDT's | deja 
s 
ea 
E amantes [(h7) + a(T+hT)e- TS +...) 
s 
ThE —Ts 
= so [(hTje T+ 
s 


+(TAhT)e TS +... | (4.26) 


Comparando (4.26) com (3.40) pode-se 
escrever: 


Es =“ 


X(9) = 5 eA-HTs x(a,m)] nom) 


m=h, z+- 


em que z — e7S significa que 2 é substi- 
tuído por e?* em X(z,m). 


(a) (b) 


a(t) z(t) ET 
ZOH 1 1 1 ! 


nT(h+ IT, 


(BA BT. O AT (h+DT (n+3)T t 
Ha 2p Sur 
te) X(2,m) Im, eco 
2(hT),a(T + hT),... 
X(s Z X(s 
(5) e (i-h)Ts TEST Z el-h)Ts zZoH ) 


FIGURA 4.10: (a) Sistema com amostra- 
dor assíncrono seguido de ZOH, (b) sinais 
de entrada e saída, (c) sistema equiva- 
lente ao sistema em (a), mas com instan- 
tes de amostragem 0,7,27,.... 


A interpretação do resultado no Exem- 
plo 4.3.2 é importante e útil. Primeiramente, 
precisamos deslocar o sinal x(t) de tal ma- 
neira que um amostrador síncrono, ou seja, 
com instantes de amostragem T, 27, 37T,... 
retorne os mesmos valores que o amostrador 
assíncrono com instantes de amostragem AT, 


T+hT,2T+hT,.... O leitor pode verif- 
car facilmente que atrasando o sinal x(t) de 
(1 — A)T e usando um amostrador síncrono 
com início em T tem-se os seguintes valores 
Í(hT), (TT +HAhT), v(27 + AT),.... Esses 
valores podem ser obtidos pela operação in- 
versa da transformada Z modificada do si- 
nal com m = h (ver Eq. 3.40). Após garan- 
tir que os valores são os corretos e ter a sua 
representação X(z,m), m = h, precisamos 
reposicioná-los no eixo tempo. Portanto, é 
necessário adiantar o sinal de (1 — h) após 
a amostragem síncrona. Esse procedimento 
está ilustrado na Figura 4.10c e está descrito 
matematicamente pela equação (4.27). 


ls: 
[é 
Ei 


g 


Deve ser enfatizado que os sistemas ilus- 


trados na Figura 4.10c é equivalente ao da 
Figura 4.10a, pois os sinais de entrada e 
saída são os mesmos. A diferença funda- 
mental entre as duas representações é que 
no sistema da Figura 4.10c o amostrador 
ideal é síncrono, ao passo que aquele do sis- 
tema da Figura 4.10a é assíncrono. A fim de 
acomodar a diferença é necessário represen- 
tar o sinal composto com os valores x(AT), 
a(V+hT),... nos instantes 7, 27,..., o que 
é feito pela transformada Z modificada in- 
versa, como pode ser constatado observando 
a definição (3.40). 


all 


Exemplo 4.3.3 


Considere o sistema indicado na Fi- 
gura 4.11. Desejamos representar a saída 
como uma função da entrada. Em parti- 
cular, como a entrada é amostrada, pro- 
curamos representar C(z) como o pro- 
duto de M(z) pela transformada de uma 
função, que representa o sistema. A difi- 
culdade deste problema reside no fato de 
que apesar de os dois amostradores tra- 
balharem com o mesmo período de amos- 
tragem T (o sistema é mono-taxa), os 
amostradores estão assíncronos, pois um 
toma mostras nos instantes 0,7,2T...e 
o outro em AT, (h+IDT,...,0O<h<1. 


M(s) = 
Ga(s Go(s 
oram (O NT (ANT, C(s) 


(A+2)T,... 


FIGURA 4.11: Sistema mono-taxa com 
dois amostradores assíncronos. 


A solução deste problema requer rees- 
crever o segundo amostrador seguido de 
Ga(s) referenciado ao primeiro amostra- 
dor, pois nesse caso os amostradores es- 
tarão sincronizados. À fim de reescrever 
o segundo amostrador e Gs(s) usando um 
amostrador que esteja síncrono ao pri- 
meiro, utilizaremos o resultado obtido no 
Exemplo 4.3.2. Para isso podemos subs- 
tituir o amostrador assíncrono por um 
síncrono, como mostrado na Figura 4.12. 
Deve ser notado que foi usado o resultado 
da Figura 4.10. 


Assim, para o sistema equivalente mos- 
trado na Figura 4.12, pode-se escrever: 


A(s) = eU VEG(s)M*(5) 

A*(s) = om a (JM es 

A(2) = Ze MPG(s) 

Efe Gi(s)M(2) 
( 


| 
Q 
E 
e 
W 
E 
= 
3 
pl 
W 
E 
2 
ES 
NO 
(0,0) 
a 


em que se usou a definição (3.39) e se fez 
a mudança de variáveis 2 < e? nas fun- 


ções estreladas. Prosseguindo, podemos 
escrever: 


B*(s) = eTS A*(s) 
B(z) = zA(z) = 2 Gi(z,m)lm=n M(z). (4.29) 


FIGURA 4.12: Sistema equivalente com 
dois amostradores síncronos. 

Deve ser notado que como e! corres- 
ponde a um bloco em que a saída é igual 
à entrada adiantada de T unidades de 
tempo, então como a entrada é uma fun- 
ção estrelada, a saída também o é. À 


saída C(s), portanto, pode ser expressa 
como 


Co = e Cos E) 
C'(s) = [e"TGo(s)B“(s)] 
C(a) = Z(e"Go(s))B(2) 
= ele a 
e antes Cen 
= Gal) B(Z), 
e, como antes, fez-se a mudança de variá- 
veis z <- e!5 nas funções estreladas. Por 


fim, combinando os resultados em (4.29) 
a (4.30) obtemos: 


C(z) = Gal m)Im-1-n 2 Gu(z mm M(z). (4.31) 
Suponha que em determinada apli- 


cação o primeiro amostrador fecha em 
0,10,20... milisegundos e que o segundo 


amostrador fecha em 4,14,24... milise- 
gundos, sendo T = 10ms. Nesse caso 
h = 0,4 e a expressão (4.31) torna-se: 


Cx = Col, 06)2Gio 02)M(2): 


Portanto é possível descrever siste- 
mas com atraso ou com amostradores 
mono-taxa, mas assíncronos, em termos 
da transformada Z modificada, com va- 
lores adequados do parâmetro m. 


4.4 Resposta em 
Frequência 


Um dos conceitos mais úteis na análise e 
projeto de sistemas lineares invariantes no 
tempo é a resposta em frequência de um sis- 
tema, que é definida como a transformada 
de Fourier da respectiva resposta ao im- 


pulso. Considere um sistema discreto está- 
vel cuja resposta ao impulso é g(k), k > 0. 
A resposta em frequência é definida como 
Flg(k)) = G(e'?). Como a resposta em 
frequência G(e/º) é uma função complexa da 
frequência w, é útil representá-la na forma 
polar |[G(e') ei), em que |- | indica o mó- 
dulo e ó(w), a fase. Tanto o módulo como a 
fase dependem da frequência e esse fato é o 
cerne do significado da resposta em frequên- 
cia. 


4.4.1 Interpretação 


Considere um sistema linear invariante no 
tempo e estável, excitado por um sinal se- 


noidal de frequência w. Para facilitar a dis- 
cussão, suporemos que a fase da entrada é 
nula e sua amplitude máxima é um. Em es- 
tado estacionário, a saída desse sistema tam- 
bém é um sinal senoidal, mas possivelmente 


diferente do sinal da entrada. À única carac- 
terística do sinal de entrada que permanece 


imutável é a frequência, mas tanto a ampli- 


tude como a fase do sinal de saída são, em 
geral, diferentes aos correspondentes valores 
no sinal de entrada. A resposta em frequên- 
cia do sistema estabelece como a amplitude e 


fase do sinal de saída são alterados com res- 
peito à entrada quando o sistema atingir o 


estado estacionário. Em particular tem-se a 
seguinte relação: 


vkT) = |e(e“D|sen(wkT + P(w)), (4.32) 


em que y(kT) é a saída do sistema no domí- 
nio amostrado (argumento tem unidade de 
tempo) e y(k) é a saída em tempo discreto 
(o argumento é adimensional). A Eq. 4.32 
mostra que a amplitude do sinal de saída é 
igual à do sinal de entrada multiplicada pelo 
módulo da resposta em frequência, |G(e“D)]|, 
na frequência da excitação. Correspondente- 
mente, a fase do sinal de saída é igual à fase 
do sinal de entrada adicionada da fase da res- 
posta em frequência, G(w), na frequência da 
excitação. Esse resultado é derivado de ma- 
neira formal a seguir. 


A transformada Z de um sinal senoidal 
discreto é dada por: 


zsenwT 
(z— eivT) (2 —e-ivT)) 


Z(senwkT) = 4.33) 


em que T é o intervalo de amostragem. Seja 
G(z) a função de transferência de um sistema 
estável de ordem n do qual se deseja obter a 
resposta em frequência. A transformada Z 
da saída desse sistema quando excitado pelo 
sinal senoidal em (4.33) pode ser decomposta 
em frações parciais como 


C(z) senwT 
=G ) ; 4.34 
z (a) (z — ev T)(z — e-ivT) (Res) 
fee A B | CG | | Cn 
z-eiuT Coe duT  2opo CC za 


Como o sistema é estável, em estado estacio- 
nário, ou seja para k — oo, os termos no do- 
mínio de tempo discreto correspondente aos 
polos da planta vão a zero e 
Az Bz 
Caos | (4.35) 


Z— ejuT ia eTIWT”? 


em que C.e(z) indica a transformada Z da 
resposta em estado estacionário. No domínio 
do tempo, tem-se que 


ColkT) = A (DP + B(e TE, (4.36) 
As constantes 4 e B em (4.35) podem 


ser determinadas pelo método dos resíduos. 
Assim 


; T 
e E “AME sent 
(2 — elvDa(z) (ESSE) | id 
= G(eieT) senwT = G(ee7) 
Es (ejwT EE; eiwT) 2j 
G(eivT eiólw) 
ele Eu (4.37) 


em que a representação em coordenadas po- 
lares foi utilizada no último passo. Como 
B = A*, (4.36) pode ser reescrita como: 


jwT pow jwT —IB(w 
IG(ei Ie? "(eum IG(e le IH "era 
25 23 
jlwkT+ó(wW)] — e—ilvkT+ó(W)] 
=IG jJwT e 
Hei] 


= |G(ei“T3|sen[wkT + P(w)], (4.38) 


Cee(kT) = 


que comparado a (4.32) mostra que G(ei“7) 


é, de fato, a resposta em frequência. 


4.4.2 Representação gráfica 


No caso de sistemas de tempo contínuo, a in- 
terpretação da resposta em frequência é igual. 
Contudo, nesse caso a representação mate- 
mática é mais simples, pois os polinômios 
do numerador e denominador são expressos 
como potências de jw, em vez de potências de 
eivT'. Hendrik Wade Bode mostrou que, gra- 
ças a isso, tanto o logaritmo do módulo como 
a fase da resposta em frequência de sistemas 
contínuos podem ser aproximados por retas, 


chamadas assíntotas, ao usar uma escala lo- 
garítmica para a frequência. Assim, o uso de 
assíntotas grandemente facilita o traçado do 
diagrama de Bode. 


No caso discreto, como visto, na função 
de transferência aparecem funções transcen- 
dentais da forma (e7s)*, k € IN. No contexto 
de funções de transferência, esse inconveni- 
ente foi contornado, ço mão da mu- 
dança de variáveis 2 — e!s. No caso da res- 
posta em frequência, dobrado: o argumento 
da função deve ser frequência, e a função 
de transferência é avaliada em s = jw, ou 
seja, a expressão matemática da resposta em 
frequência tem termos da forma (ei:T)*. k e 
IN. Portanto, a expressão matemática da res- 
posta em frequência de um sistema de tempo 
discreto ainda tem funções transcendentais, 
razão pela qual a representamos como G (e!“), 
e a consequência imediata é que as relações 
entre o logaritmo do módulo e da fase com 


a frequência não mais podem ser aproxima- 
das por retas assíntotas. Contudo, a res- 
posta em frequência é perfeitamente passível 
de ser representada graficamente, por exem- 
plo, usando um computador. 


Exemplo 4.4.1 


Usamos aqui o resultado obtido no Exem- 
plo 4.1.2, em que, para a saída do sistema 
amostrado indicado na Figura 4.4, foi en- 
contrado: 


Sent)» 
2(2z-e2D)z—1 


Cla = 


para entrada degrau unitário. A função 
de transferência do sistema é: 
Glen DS qe) 
Mena 


e, portanto, a resposta em frequência é: 


Cd) 3 (1-7) 
M (eis) "5 (cjuT -e-21)' 


(4.39) 


cuja representação gráfica é mostrada na 
Figura 4.13. O respectivo código MA- 
TLAB é: 


T=0.1; ) intervalo de amostragem 


% sistema 
num=3*(1-exp(-2*T)); ) numerador de (4.39) 
den=[2 -2+xexp(-2*T)]; Y denominador de (4.39) 


% faz o gráfico da resposta em frequência 
dbode (num, den, T) ; 


A máxima frequência representável, 
indicada pelo traço vertical na Fi- 
gura 4.13, éws/2 = 1/T = 314159. Note 
o efeito do segurador de ordem zero sobre 
a fase (ver Exercício 4.8). 


20 log, p|G(e')| 


à (w) 


-200 1 1 
101 10º 10! 102 
rad/s 


FiGURA 4.13: Resposta em frequência 
do sistema cuja função de transferência é 
dada por (4.39). 


4.4.3 Transformação bilinear e 
resposta em frequência 


Para desenhar assíntotas é necessário voltar 
a ter uma relação linear na frequência. Isso 
pode ser obtido com a transformação bilinear 
(ver Seção 3.3.1). Mas nesse caso a interpre- 
tação da frequência é diferente, como visto a 
seguir. 


O uso da transformação bilinear (ver 
Eq. 3.31) implica que quando z estiver sobre 
o círculo de raio unitário no plano z, ou seja 
|| = 1 = eT w estará sobre o eixo ima- 
ginário do plano complexo “ww, ou seja, sobre 
Iww (ver Exemplo 3.3.4). Desejamos, então, 
saber como a frequência no domínio w se re- 
laciona à frequência original, no domínio s. 
Para isso escrevemos a partir de (3.31) 


w lt = 


Jww = 


Way — 


A Eq. 4.40 relaciona a frequência no novo 
domínio w, com a frequência física w. Para 
valores suficientemente pequenos de w, temos 
as seguintes aproximações sen wT'/2 =: 
e coswT/2 = 1 e a Eg. 4.40 pode ser reescrita 


como 


| 
Ao O PR 
)) iv” 41 )) IvT/2ejvT/2 4 


T sT41 T eIvT/2gjvT/241 
9 eivT/2 (gjwT/2 RE Eae) 


“7 cIsT/(eJsT]2 + e-I9T/2) 


2 2; senwT'/2 


= T 2 coswT/2 


Zen) quo 


Uy E = Eu. (4.41) 


wT'/2 


Na prática consideramos a aproximação em 
(4.41) aceitável sew < ws/10. Como a frequên- 
cia máxima representável é w./2, a aproxima- 
ção de ww é aceitável para frequências de até 
cinco vezes menor que que a máxima frequên- 
cia representável. 


Exemplo 4.4.2 


Voltamos a considerar o resultado do 
Exemplo 4.4.1, em particular a função de 
transferência em z: 


Cie o ue 
M(2) — 2(z- e fo, 


Desejamos utilizar a transformada bi- 
linear a fim de calcular a resposta em 
frequência como se a função fosse uma 
função de transferência em s (na reali- 


dade é uma função de transferência em 
w). À seguir constatamos o resultado 
expresso em (4.41). Usando (3.32), re- 
produzida abaixo por conveniência, 


aI+(T/u 
EaD 


em (4.42) tem-se 


ES oa 1 
El 340 JEmDe a 
T=(T/2)w 
2—-Tw (4.43) 
— a E 
2-2e2T4 TA Lew! 
em que a = 1,5(1 — e 27). Note que 


(4.43) é uma razão de dois polinômios 
em w, que tem interpretação análoga a 
polinômios em s. O diagrama de Bode 
de (4.43), ou seja, o diagrama de G(jww) 
é mostrado na Figura 4.14. 


O comando usado nesse caso é bode 
e não mais dbode, necessário para o caso 
em tempo discreto. Na Figura 4.14 é 
possível constatar que para frequências 
até aproximadamente ws/10, G(ev7) » 
G(jww), como indicado em (4.41). 


20 log, (|G(e!”)], |G(jw)]) 


O (ww), & (w) 


-200 : : 
101 10º 10! 102 
rad/s 


FIGURA 4.14: Resposta em frequência 
do sistema cuja função de transferência é 
dada por (4.39) e respectiva função de 
transferência em w, G(jww), dada em 
(4.43). A linha vertical à direita corres- 
ponde à frequência limite ws/2 e a linha 
vertical pontilhada corresponde a ws/10. 


4.5 Complementos 


Complemento 4.1. Discretização 


Dada uma função em tempo contínuo ou 
no domínio de Laplace, pode ser necessá- 
rio ou interessante obter uma representação 
em tempo discreto equivalente. Há diver- 
sos métodos disponíveis, alguns dos quais são 
mencionados neste complemento na forma de 
exemplos. 


Exemplo 4.5.1 


O método de invariância da resposta ao 
impulso foi utilizado quando falamos de 
como obter M*(s) a partir de M(s) (ver 
Exemplo 2.3.5). Partimos de uma função 


de transferência em s: 


(s+3) 


CUTE Te 


(4.44) 


e a decompomos em frações parciais 


2 1 
= eTe-Ts TE e2Te-Ts É 


Mis — 


Por fim, fazemos a troca de variáveis z — 
e”s para obter 


2 1 
Es Se Ri EE 
x 2a z 
oa voçe 


em que vemos que os polos de M(s) em 
s=-—les=-2 foram mapeados, via 
= e" paga = ese mm 


plano z, respectivamente. 


Para T = 0,2 a função de transferên- 
cia em z é: 

22 — 0,5219z 
22 — 1,4892 + 0,5488' 


An 


A função c2d do Matlab converte fun- 
ções de transferência de tempo contínuo 
para tempo discreto. Essa função, con- 
tudo, implementa vários métodos. O pre- 
sente método é chamado usando-se a op- 
ção impulse, como se segue: 


) definição de M(s) 

num=[1 3]; Y numerdor 

den=conv([1 1], [1 2]); Y denominador 
4% função de transferência em s 
sysc=tf (num,den) ; 


4% conversão para discreto usando c2d 


T=0.2; ) tempo de amostragem 
sysd=c2d(sysc,T,'impulse?) 


em que M(z) aparece em sysd, M(s) em 


sysc. À resposta ao impulso dessas fun- 
ções de transferência estão mostradas na 
Figura 4.15. 


1 
0.8, 
0.6r 
0.45 
0.25 
0 Do a + 
= 8 4 &B 8 


FIGURA 4.15: Respostas ao impulso de 
M(s) (em traço contínuo) e de M(z) (as- 
teriscos) apresentadas no Exemplo 4.5.1. 


Exemplo 4.5.2 


No método ilustrado neste exemplo, os 
polos e zeros de M(s) são mapeados di- 
retamente para o plano z usando z = 
es. Assim, para M(s) em (4.44), 
o zero em s = —3 é mapeado para 
z = 0,5488 quando T = 0,2. A fun- 
ção de transferência retornada pelo co- 
mando sysd=c2d(sysc,T,'matched”), 
com sysc definido no Exemplo 4.5.1, é: 


019872 = 0,1090 
22 — 1,4890z + 0,5488' 


uia 


em que matched indica que os polos e 
zeros de M(z) foram obtidos pelo mape- 
amento (“casamento”) dos polos e zeros 


de M(s). 


Exemplo 4.5.3 


O método usado neste exemplo resulta 
na função de transferência de pulsos de- 
finida como 


a E a (He (4.45) 


O nome de equivalente ZOH ocorre, pois 
a função de transferência de pulsos (do 
termo em inglês pulse transfer function) 
é a transformada Z de M(s) vezes a fun- 
ção de trans ierências do segurador de or- 
dem zero (ZOH) =“. Como, após ma- 
nipulações, basta tomar a transformada 
Z da resposta ao degrau de M(s), ou 


seja, a função temporal correspondente 
a M(s)/s, alguns autores chamam este 
método de “invariância ao degrau” (Mid- 
dleton e Goodwin, 1990, p. 117). 

Para M(s) em (4.44), começamos re- 
solvendo a decomposição em frações par- 
ciais: 

M(s) (s+3) A B E 


s (esco (GM GED" E 


, 


em que 4 = -2 Bb -05eC=-1la. 
A partir desse ponto, basta encontrar a 
respectiva transformada Z na tabela, ou 
seja, 


a(o) 2a O 000 lo 


cena | | 
Ze ce 


o que, para T = 0,2 resulta em 


DSi = UN he! 


M = 
(2) 22— 1,489z + 0,5488' 


que é o resultado obtido via Matlab com 
sysd=c2d(sysc,T,?zoh”), com sysc de- 
finido no Exemplo 4.5.1. 

Note que, se a entrada R(z) for um 
degrau unitário, a resposta ao degrau de 
um sistema com função de transferência 


M(z) é: 


S 


-s (2, (4.46) 


ou seja, a resposta ao degrau no domínio 
z é a versão discreta da resposta ao de- 
grau no domínio s, o que justifica o nome 
de invariância da resposta ao degrau. 


Exemplo 4.5.4 


O último método a ser abordado é o de 
Tustin. Neste método é utilizada a trans- 
formação bilinear descrita na Seção 3.3.1. 


Portanto, em (4.44) fazemos a seguinte 
mudança de variáveis: s — c(z— 1) /(z + 
1), c= 2/T, o que resulta em 


z—1 
G ERR 
M(z) = é 
Es +1) (= -2) 
gia god! 
(c+3)z2 +623-c 
— (43042)224+(4-202)2 42402 3e' 


(4.47) 


em que c = 2/T = 10. O comando Ma- 
tlab sysd=c2d(sysc,T,'tustin?), com 
sysc definido no Exemplo 4.5.1, resulta 
em 


0,0984822 +0,045452 — 0,05303 


M — 
(2) 22— 1,4852 +0,5455º 


que é idêntico ao resultado em (4.47) se 
dividirmos todos os coeficientes por c? + 
3c+2. Neste caso, apesar de a função de 
transferência em tempo contínuo ter ape- 
nas um zero, M(z) tem dois. Ver Exer- 
eileto co 


Leitura Recomendada 


O livro de Eliahu Jury sobre controle de 
sistemas amostrados desenvolve um procedi- 
mento para lidar com sistemas com amos- 
tradores operando com períodos de amos- 
tragem diferentes, digamos 7, e To, tal que 
T/To=b/q, b,gEN (Jury, 1958, Secs. 1.7, 2.8). 
Nesse mesmo livro, o autor trata com deta- 
lhes o caso de sistemas com atraso puro de 
tempo (Jury, 1958, Sec. 2.15). 


Exercícios 


Com respeito ao script simrk ph teste pede- 
se: 


1. reconheça no código onde e como se 
emula o processo de amostragem da 
saída do processo; 


2. trace e compare os diagramas de Bode 
das funções de transferência implemen- 
tadas nesse script; 


3. nos exercícios do Capítulo 3 foi pedido 
encontrar um modelo em tempo contí- 
nuo G(s) a partir da resposta ao de- 
grau. Use o modelo encontrado para: 


a) traçar o diagrama de Bode e 
compará-lo aos encontrados no 
item 2 acima; 


b) discretize G(s) usando os proce- 
dimentos discutidos no Comple- 
mento 4.1. Compare o desem- 
penho dos modelos discretizados 
com o correspondente em tempo 
contínuo. 


4.1. A veracidade da expressão C(jw) = 
G(jw)M*(jw) na Seção 4.1, supõe que a 
banda de passagem de G(jw) é bem me- 
nor que a frequência de amostragem utili- 
zada para amostrar m(t). Comente, ilus- 
trando com gráficos a necessidade e pertinên- 
cia dessa consideração. 


4.2. No desenvolvimento da Eq. 4.5 foi usada 
a relação [M*(s)|* = M*(s), ou seja, ao pas- 
sar o sinal m*(t) por um amostrador ideal, o 
sinal não é alterado. Faça um desenho dessa 
situação e discuta sob que condições esse re- 
sultado é verdadeiro. 


4.3. No desenvolvimento da Eq. 4.5 foi usada 
a relação [M*(s)|* = M*(s), que no domí- 
nio de frequência pode ser expressa como 
[M*(gw)|* = M*(gw). Mostre graficamente 
a validade desse resultado. 


4.4. No desenvolvimento da Eq. 4.5 foi usada 
a relação [M*(s)|* = M*(s), pois assumiu- 
se que a amostragem era ideal. Mostre que 
essa relação não é mais válida para o caso de 
amostragem não ideal. 


4.5. Explique a observação feita ao final do 
Exemplo 4.1.2 e mostre que esse resultado é 
válido para a entrada em degrau, mas não se 
aplica em geral para outros sinais. 


4.6. Compare criticamente a expressão ob- 
tida no Exercício 4.5 com aquela que é obtida 
amostrando-se a resposta ao degrau unitário 
de um sistema contínuo G(s) = 1/(s + 1). 
Quão geral é a conclusão a que chegou? 


4.7. Justifique o nome função de transfe- 
rência de pulsos. Dica, use a Figura 4.7 em 
que G(z) é essa função. Note que, matema- 
ticamente M*(s) pode ser considerada como 
a entrada de G(z), ainda que fisicamente a 
entrada é um sinal discreto. 


4.8. Trace a resposta em frequência de G(2) = 
32/(2 — e 27) para T = 0,1 e compare com o 
gráfico mostrado na Figura 4.13. Explique a 
razão das principais diferenças. 


4.9. Considere o sistema mostrado na Fi 
gura 4.7, com a seguinte informação: 


m(kT) = 2e(kT) -e(kT —T) 
1 
ue s+1º 
e o interpolador é o segurador de ordem zero. 


Determine a expressão no tempo para a res- 
posta ao degrau desse sistema. 


4.10. Qual é a transformada de pulsos da 
planta G(s) = a/(s + a) se o interpolador 
usado for o segurador de ordem zero com 
amostragem 1"? 


4.11. O Complemento 4.1 apresenta quatro 
formas diferentes de discretizar uma função 
de transferência. Compare por simulação as 
quatro funções de transferência M (2) encon- 
tradas nesse complemento. 


4.12. A função de transferência de um pro- 
cesso de levitação de uma esfera de isopor 
por fluxo de ar, em tempo contínuo, é dada 
por (Santos et al., 2019): 


—0,3752s + 0,7549 
s3 + 382 + 2,5304s + 0,7496. 
(4.48) 
Determine a localização de polos e zeros de 
Gp(s). Encontre a função de transferência de 
pulsos, G(z), correspondente para T = 0,55. 


Gp(s) = 


Por simulação compare as respostas ao de- 
grau unitário de ambos os modelos. Compare 
a localização de polos e zeros desses modelos 
usando o mapeamento z = e”. Comente. 


Capítulo 5 


Sistemas 


Amostrados em 
Malha Fechada 


Neste capítulo desejamos considerar sistemas 
amostrados em malha fechada. “Fechar a ma- 
lha” é um passo importante a fím de abor- 
dar o problema de projeto de controladores 


visto no Capítulo 6. (Começaremos apren- 
dendo a derivar a função de transferência de 
malha fechada para um sistema amostrado. 
Como estudado no Capítulo 4, a presença de 
amostradores na malha requer alguns cuida- 
dos especiais no desenvolvimento de funções 
de transferência. Os procedimentos a serem 
seguidos são parecidos àqueles estudados no 
capítulo anterior. 


Um sistema com realimentação negativa 
torna-se menos sensível a mudanças no bloco 
“planta” e a aspectos que podem ser indese- 
jados em algumas situações como, por exem- 
plo, não linearidades. Além disso, a reali- 
mentação negativa permite projetar sistemas 
para seguimento de trajetórias bem como para 
rejeição de distúrbios, como visto no Capí- 
tulo 6. Por outro lado, um sistema que em 
malha aberta é estável pode tornar-se ins- 
tável ao se fechar a malha via realimentação 
negativa. Por isso é importante saber sob que 


condições um sistema que é estável em malha 
aberta permanece estável em malha fechada. 
Também é possível que um sistema instável 
em malha aberta seja estabilizado em malha 
fechada. Felizmente, o critério para analisar 
essas situações é o mesmo e é apresentado no 
presente capítulo. 


5.1 Diagrama de Blocos 


A Figura 5.1 mostra o diagrama de blocos 
de um sistema amostrado em malha fechada. 
A função de transferência de ramo direto é 
G(s). À função de transferência do ramo de 
realimentação é H(s). A função de transfe- 
rência de malha é G(s)H(s). Alguns autores 
chamam G(s)H(s) de função de transferên- 
cia de malha aberta, pois imagina-se que a 
malha se abre logo antes do ponto de soma. 
Ainda outra denominação para G(s)H(s) é 
função de transferência de laço. A seguir ob- 


temos a função de transferência de malha fe- 


chada. 


FIGURA 5.1: Diagrama de blocos de sistema 
amostrado em malha fechada. 


alh; [ml] 
o 


te 


As seguintes relações podem ser escritas 


para a malha mostrada na Figura 5.1 
C(s) = G(s)E*(s) 
E(s) = R(s)-— H(s)C(s). (5.1) 


Substituindo C'(s) dado na primeira equação 
na segunda tem-se: 


E(s) = R(s)— H(s)G(s)E“(s). (5.2) 


Amostrando de maneira fictícia ambos os la- 
dos de (5.2) corresponde a tomar a “transfor- 
mada estrela” dos dois lados dessa equação, 
o que resulta em: 


E“(s) = R*(s) —- HG (sS)E*(s), (5.3) 
e isolando E*(s) temos: 
je RO =. im 
1+ HG (s) 
Substituindo (5.4) na primeira equação de 
(5.1) e “estrelando” ambos os lados chega-se 


dos O 
att o GORRO (O) 
C'(s) = T+ HO (3) (5.5) 
e, por fm, temos 
Cl) Gg) 
Rs) 1+ HG (s) 
Cl)  G() 
Bla) 14 Hc(2)' (o) 


que é a função de transferência em malha fe- 
chada do sistema amostrado da Figura 5.1. É 
interessante observar que tivéssemos tomado 
a transformada estrela da Eqg. 5.1, chegaría- 
mos a E*(s) = R*(s) — HC (s) e, portanto, 
não poderíamos fatorar o termo HC” (s). Para 
evitar essa situação, Phillips e Troy-Nagle 
(1995) propuseram o procedimento descrito 
a seguir: 


desenhar o diagrama de fluxo de sinal 
do sistema. Nesse diagrama os amos- 
tradores são indicados por dois nós sem 
conexão entre si. Esse é o diagrama de 
fluxo de sinal original; 


designar uma variável à entrada de 
cada amostrador e indicar com estrela 
a mesma variável à saída do amostra- 
dor; 


considerar a saída de cada amostrador 
como uma fonte. Expressar a entrada 
de cada amostrador e a saída do sis- 
tema em função da saída de amostra- 
dores; 


estrelar cada equação obtida no passo 
anterior, e 


resolver o sistema de equações resul- 
tante, expressando o resultado na forma 
do ganho entre a entrada e a saída. 


Seguiremos esses passos para obter a fun- 
ção de transferência de malha fechada do di- 
agrama de blocos mostrado na Figura 5.1. O 
resultado das primeira duas etapas está mos- 
trado na Figura 5.2. 


FigurA 5.2: Diagrama de fluxo de sinal 
correspondente ao sistema amostrado da Fi- 
gura 5.1. 


O terceiro passo resulta em 


E(s) R(s) — G(s)H(s) E*(s) 
C(s) = G(S)E%(8). (5.7) 


Estrelando essas equações como requerido pelo 


quarto passo, temos: 


E*(s) — Rº(s) 


— GH (s)E*(s) 
C*(s) = G*(s)E“(s). 


(s 


Resolvendo esse sistema de equações 
e expressando o resultado na forma de 
C*(s)/R*(s), chega-se à expressão em (5.6). 

Se o sistema original for mais complicado, 
contendo diversas malhas, pode ser conveni- 
ente resolver o quarto passo utilizando a re- 
gra de Mason. Nesse caso, desenha-se um 
outro diagrama de fluxo de sinal que corres- 
ponde ao conjunto de equações de variáveis 
estreladas, que é chamado diagrama de fluxo 
de sinal do sistema amostrado. A regra de 
Mason pode então ser aplicada a esse dia- 
grama de fluxo de sinal para resolver o sis- 
tema de equações resultante. 


(5.8) 


Exemplo 5.1.1 


Considere o sistema amostrado da Fi- 
gura 5.3 (Franklin et al., 1998). Aplica- 
mos o procedimento descrito nesta seção 
para verificar a possibilidade de encon- 
trar a função de transferência de malha 
fechada. 


FigurA 5.3: (a) Diagrama de blocos e 
(b) diagrama de fluxo de sinal do sistema 
considerado no Exemplo 5.1.1. 


Começamos desenhando o diagrama 
de fluxo de sinal (Fig. 5.3b). Por motivos 
de clareza, por agora, usamos a variável 
X(s) no lugar de C(s), mas é importante 


notar que se trata da mesma variável. A 
seguir escrevemos a entrada do amostra- 
dor da saída C(s) em função da saída dos 
demais amostradores: 


C(s)=R(sS)G(s)—-H(s)G(s)X*(s). (5.9) 


O procedimento proposto por Phil- 
lip e Troy Nagle requer que a entrada 
de cada amostrador e a saída do sistema 
sejam escritos em função das saídas dos 
amostradores. Contudo, neste caso, os 
dois amostradores envolvem as mesmas 
variáveis, pois C(s) = X(s) e C*(s) = 
X*(s), que por sua vez também é a saída 
do sistema. Portanto, a única equação 
a ser escrita é (5.9). A seguir tomamos 
a transformada estrela de ambos os la- 
dos de (5.9) e manipulamos o resultado, 


como visto a seguir: 


C(s)ji-FHG (5)|= RG (5) 


que não pode ser colocada na forma de 
C(s)/R(s) devido à falta de um amos- 
trador na entrada da malha. 

A barra sobre HG" (s) em (5.10) pode 
surpreender pelo fato de haver um amos- 
trador entre G(s) e H(s), à saída do dia- 
grama. Contudo, deve ser observado que 
não há amostrador entre esses blocos do 
lado da entrada, ou seja, a saída de H(s) 
chega a G(s) via M(s), sem passar por 
um amostrador. Isso justifica a barra so- 


bre HG" (5). 


Exemplo 5.1.2 


Voltamos a considerar o sistemas rea- 
limentados mostrados nas Figuras 5.1 
e 5.3a. Desejamos, à semelhança do que 
foi feito no Exemplo 4.2.1 expressar a 
saída C(s) — amostrada ficticiamente — 
em termos da transformada Z modifi- 
cada. 

Para o sistema da Figura 5.1 tem-se 
C(s)=G(s) E*(s), a transformada Z mo- 
dificada dessa expressão é: 


Cim- Clem B() 
G(z,m) 


- TER (5.11) 


Para o sistema da Figura 5.3a, ao to- 
mar a transformada Z modificada de (5.9), 


Exemplo 5.1.3 


Considere o sistema amostrado de con- 
trole mostrado na Figura 5.4. Deseja- 
se obter a função de transferência 
C*(s)/R*(s). Para isso seguiremos os 
passos enunciados anteriormente. 


A(s) / A*(5) C(s) 


A . É 5) | (e) Tt E a SS Gols) 
H(s) 


FIGURA 5.4: Diagrama de blocos do 
Exemplo 5.1.8. 


O diagrama de fluxo de sinal do sis- 
tema original é mostrado na Figura 5.5 a 
partir do qual pode-se escrever 


A(s) = Gi(s)E*(s) — Go(s)H(s) A*(s) 
E(s) — R(s) — Gols) A*(8) 
C(s) = Ga(s)A*(s). 


FIGURA 5.5: Diagrama de fluxo de sinal 
do sistema original da Figura 5.4. 


Estrelando cada uma dessas equações re- 
sulta em 


As) = Gi(s)E“(s) — GaH (s)A*(s) 
E“(s) = Rº(s)- Gi(s)A*(s) (5.13) 
Cs) —- Gio (Ss). 


Se fôssemos resolver o exemplo apli- 
cando a regra de Mason (ver Exercí- 
cio 5.2), o conjunto de equações (5.13) 
deveria ser representado na forma de um 


diagrama de fluxo de sinal do sistema 
amostrado. Contudo, como o número 
de equações ainda é pequeno, podemos 
resolvê-las por manipulações algébricas. 
Como a variável A*(s) é interna, achare- 
mos uma expressão para ela e a utiliza- 
remos para eliminar tal variável depois. 
Portanto, substituindo a segunda equa- 
ção de (5.13) na primeira, tem-se: 


A“(s) = Gi(s)[R(s) — Go(s) A“(s)] — 
—“GoH (s)A*(s) 
A(s)[L + GY(s)G3(s) + GoH' (s)] = 
Gi(s)R'(s) 


E Gils)R'(s) 
1+G5(s)G5(s)+G5>H (8) 


A*(s) . (5.14) 


Substituindo (5.14) na terceira equação 


de (5.13) chega-se a: 


C(9)=Gil9)— Gate aa 
+GI)GH9) + (9) 
es Gi(s)G5(s) 

R(s) 1+G&(S)Gs(5) + 5H (8)' 


que é a função de transferência procu- 
rada. 


5.2 Análise da Equação 
Característica 


Um sistema discreto linear e invariante no 
tempo (LIT) pode ser descrito por modelos 
matemáticos paramétricos e não paramétri- 
cos. Um exemplo de modelo não paramétrico 
é a resposta ao impulso do sistema, que in- 
dicamos por g(k), k E N, para o caso de um 


sistema causal. A transformada Z da res- 
posta ao impulso é, por definição, a função 
de transferência do sistema, que podemos in- 
dicar por G(z) = Z(g(k)). 

Um sistema discreto com resposta ao im- 
pulso g(k) é dito assintoticamente estável se 


lim g(k) =0, (5.15) 


k—00 


e é dito estável se 


lim |g(k)j=c< o, (5.16) 
k—00 
em que c é uma constante, ou seja, se o valor 
final da resposta ao impulso for finito, mas 
diferente de zero. A condição para a estabi- 
lidade assintótica em (5.15) pode ser escrita 
como 


Din l<M<o, (5.17) 


em que M é uma constante finita. Ou seja, a 
resposta ao impulso de um sistema discreto 
assintoticamente estável é uma sequência ab- 
solutamente somável. Esse tipo de análise de 
estabilidade é um exemplo do que se conhece 
pelo nome de estabilidade BIBO, do inglês 
bounded-input, bounded-output. A ideia é que 
um sistema que seja BIBO estável, ao ser ex- 
citado por uma entrada limitada, produzirá 
uma saída também limitada. 


Uma outra maneira de abordar o problema 
de estabilidade diz respeito ao estado interno 
do sistema. A motivação é investigar a esta- 
bilidade sem a necessidade de definir sinais de 
entrada nem de verificar a saída do sistema 
para tais entradas. Que tipo de critério, cor- 
respondente a (5.17), pode ser escrito, que 
não leve em conta a entrada e saída do sis- 
tema? À seguir tratamos desse problema que 
é às vezes chamado de estabilidade interna. 
No caso de sistemas lineares em que não há 


cancelamentos de polos e zeros em sua função 
de transferência — nesse caso dizemos que os 
polinômios do numerador e do denominador 
são coprimos — não há conflito entre as duas 
abordagens, ou seja, um sistema que é classi- 
ficado como sendo estável seguindo um pro- 
cedimento BIBO, também o é aplicando-se o 
critério de estabilidade interna, como visto a 
seguir. 

No caso de uma função de transferência 
expressa como à razão de dois polinômios 


Cc bmz” +bm-z PO L+..+bz+h 
(e) (2) mZ m-—1Z +...+biz+ LE E an £ 0 (5.18) 
R(z) anz”"+an-s2"1+...tasz+ao 


a condição de estabilidade é dada por |p;| < 
1, i = 1,2,...,n, sendo que p; indica o à 
ésimo polo de G(z). Lembrando que os po- 
los são as raízes da equação característica 
(ver Eq. 5.19). Essa condição de estabilidade 
supõe que não há polos sobre o círculo de 
raio unitário com multiplicidade maior que 


um. Portanto, se todos os polos tiverem mó- 
dulo menor ou igual a 1, o sistema é estável 
e se todos os polos estiverem estritamente 
dentro do círculo de raio unitário, ou seja, 
Ip;|<1,i=1,2,...,n,0 sistema é assintoti- 
camente estável. Portanto, esse critério, que 
não requer o uso de sinais, quer de entrada, 
quer de saída, é análogo ao critério (5.17) 


utilizado na análise de estabilidade BIBO. 
Critérios de estabilidade que têm como 
ponto de partida um modelo paramétrico do 
sistema, como a sua função de transferên- 
cia, procuram determinar se existem polos de 
G(z) fora do círculo de raio unitário. Como 


os zeros não determinam a estabilidade da 
função de transferência, é comum abordar o 


problema a partir da equação característica 


anZ” tando +...taz+ta=0, an£oO, (5.19) 


que corresponde ao denominador de G(z) igua- 
lado a zero. Portanto, se pelo menos uma das 
raízes de (5.19) estiver fora do círculo de raio 
unitário, o sistema é instável. Uma função 


de transferência que tenha algum polo sobre 
o círculo de raio unitário com multiplicidade 
maior que um também é instável. Os crité- 
rios descritos a seguir procuram determinar 
se existe alguma raíz da equação caracterís- 
tica com módulo maior que um, sem ter que 
determinar as raízes. 


5.2.1 Transformação bilinear e 
arranjo de Routh 


Um procedimento possível para determinar 
se uma equação característica tem raízes com 
módulo maior que um é realizar a transfor- 
mação de variáveis 2 — e” que sabemos ma- 
pear o exterior do círculo de raio unitário no 
semiplano direito relacionado à nova variável 
w (ver Seção 3.3). O uso desse mapeamento 
em (5.19) resulta em uma equação caracte- 
rística transcendental, com infinitas raízes. 
Para contornar esse problema usa-se a trans- 


formação bilinear derivada na Seção 3.3.1: 


AMT UT+u 


“1 (Tu 2T-w 


(5.20) 


Portanto quando z percorre o círculo de 
raio unitário no plano complexo z, w per- 
corre o eixo jw, no plano complexo w de tal 
maneira que o exterior do círculo de raio uni- 
tário é mapeado para o semiplano direito do 
plano w. Portanto, ao usar (5.20) em (5.19), 
o resultado é uma nova equação caracterís- 
tica na variável w tal que o número de raí- 
zes no semiplano direito é igual ao número 
de raízes de (5.19) fora do círculo unitário. 
Logo, o critério de Routh-Hurwitz pode ser 


aplicado à nova equação característica em w, 
como ilustrado a seguir. 


Exemplo 5.2.1 


Neste exemplo deseja-se utilizar o crité- 
rio de Routh Hurwitz para determinar as 
faixas de valores de K tais que o sistema 
em malha fechada ilustrado na Figura 5.6 
seja estável. 


FIGURA 5.6: Diagrama de blocos do sis- 
tema em malha fechada considerado no 
Exemplo 5.2.1. 


Como visto ao longo desta seção é 


necessário usar a transformação bilinear 
(3.32) para encontrar uma representação 
em w a fim de lançar mão do critério 
de Routh-Hurwitz. Começamos encon- 
trando a função de transferência de ma- 
lha, G(z), que neste exemplo coincide com 
a função de transferência de ramo direto. 
Para isso escrevemos 


G a(—— E ) K( el E ) 
(2) s s(s + 1) É s2(s+1) 


= e [(9,1 Le E q ço D,1e=00)] 
z (z — 1)2(z — e—0,1) 

0,00484z + 0,00468 

(z — 1)(z — 0,905) - 


(5.21) 


Assim, a equação característica da ma- 
lha indicada na Figura 5.6 é: 


0,004842-+0,00468 
o) 
(2 1)(2-0,905) 


1+G(2)=1+K 


o que resulta em 


22 + (1,905 + 0,00484K)z + (0,905 + 0,00468K) = O. 


Utilizando a transformação bilinear tem- 
se: 


1+0,05w 2 1+0,05w 
( ) (1,905 — 0,00484K) 
1—-0,05w 1-0,05w 


+ (0,905+0,00468K) = 0, 


que após uma tediosa, porém simples, 
manipulação resulta em 


(0,0096375 — 4x107 “K)w2+ (0,0095 — 0,000468K)w-+0,00952K = 0, 
(5.23) 


que é a equação característica no plano 
w. Portanto, verificar se a Eg. 5.22 tem 
raízes fora do círculo de raio unitário é 
equivalente a testar se a Eq. 5.23 tem raí- 
zes no semiplano direito do plano w. Por- 
tanto este último teste pode ser realizado 
por meio do critério de Routh-Hurwitz. 


Começamos montando o arranjo de Routh 


w2 | 0,0096375 — 4x107"K  0,00952K 
w! | 0,0095— 0,000468K 
wº | 0,00952K . 


Logo, as restrições para se ter estabili- 
dade são dadas pelo critério que requer 
que não haja troca de sinal algébrico en- 
tre os elementos da primeira coluna do 
arranjo de Routh, portanto 


0,0096375— 4x10-"K > 0... K < 24.093,75 
0,0095—0,000468K > 0... K < 20,299 
0,00952K > 0... K > 0. 


Por fim, a condição de estabilidade é 
dada por 


0< K < 20,299. (5.24) 


Observando o volume de contas ne- 
cessárias para aplicar o critério de Routh- 
Hurwitz para um sistema discreto, mesmo 
sendo simples, não é difícil entender por- 
que não se recomenda esse procedimento. 
A Seção 5.2.2 apresenta uma alternativa 
mais interessante. 


5.2.2 O critério de 
estabilidade de Jury 


Seja o polinômio 


Qi) =an?" Fang Il +...taztaç=0, an >0, 


o arranjo de Jury é montado da seguinte forma: 


Zz Zz z z z 
ao qa as ice An-1 On 
An An-1 GAn-D ... a (970) 
do do bo bn- 

Dri 1 E, ba-3 bo 

Co a Cn-2 

Cn-2 Cn-3 Co 


sendo que as primeiras duas linhas do arranjo 
são montadas com os coeficientes do polinô- 
mio característico Q(z) e os demais elemen- 
tos são calculados como 


bo bn-k-—1 


a a 
(0) n—k 
; bn-—1 bp 


da (5.25) 


que devem ser calculados para k = 0,1,.... 
É prático notar que em (5.25) calcula-se o 
determinante de matrizes formadas por 2 co- 
lunas, sendo que somente a segunda delas va- 
ria com k. À primeira coluna é igual aos pri- 
meiros elementos das duas respectivas linhas 


no arranjo de Jury. Por exemplo, [ao an|” 
é tal que ay é o primeiro elemento da pri- 
meira linha do arranjo (após o traço) e an 
é o primeiro elemento da segunda linha. O 
mesmo vale para bo e b, 1, que são os primei- 
ros elementos das linhas três e quatro, respec- 
tivamente. A segunda coluna, por sua vez, é 
obtida pelos último elemento das respectivas 
linhas no arranjo de Jury. Assim, para bo a 
segunda coluna é dada por [an ao)” que, de 
fato, são os últimos elementos das duas pri- 
meiras linhas. Por fim, as condições de es- 
tabilidade, que devem ser testadas na ordem 
apresentada, são: 


Q(1)>0 

(PQ >0 

ao| < Gn 

bol > |ba-| n+1. (5.26) 
Co| > |Cn-2| 


mo| > |mos| 


Ás três primeiras condições em (5.26) po- 
dem ser testadas sem a necessidade dos cálcu- 
los em (5.25). Além disso, o número total de 
condições a serem testadas é n+1, portanto, 
para sistemas de segunda ordem o teste de 
estabilidade não requer o cálculo de determi- 
nantes. Logo, dada uma equação caracterís- 
tica de grau n, as primeiras n + 1 condições 
em (5.26) devem ser testadas. Se alguma fa- 
lhar, então existe pelo menos uma raiz fora 
do círculo de raio unitário. Ao contrário do 
critério de Routh-Hurwitz, no caso de haver 
raízes fora do círculo de raio unitário, o crité- 
rio de Jury descrito nesta seção não fornece 
a quantidade dessas raízes. Seguem alguns 
exemplos. 


Exemplo 5.2.2 


A equação característica de um sistema 
discreto é 


Qlo)=2 =1252 = L dz = 025. 


Deseja-se saber se o dito sistema é está- 
vel. A primeira restrição em (5.26) já é 
violada, pois 


Q(1M)=1-1,25-13-0,25=-18<0, 


portanto, o sistema é instável, o que pode 
ser verificado calculando-se as raízes de 
Q(z) = 0, que são 1,9731, —0,4248 e 
—(,2982. 


Exemplo 5.2.3 


A equação característica de um sistema 
discreto é 


Qlep= asc LA: 


Ás primeiras três restrições em (5.26) são 


Q(1) = 1+35+40+0,8=93>0, 
(-1)Q(—1) (=1)(-1+3,55-40+0,8)=0,7>0, 
bo) = M<l=0 


as quais são todas verificadas. Como o 
sistema é de terceira ordem, é necessá- 
rio testar mais uma restrição. Para isso, 
montamos o arranjo de Jury 


pois 
| dg dg | 2H De 
bo= Ps a (0,8) 1º = —0,36 
| dg da | o free 
D= a pa (0,8)4 oh) = —0,3 
| do GM | E o 
bo = dean |O (0,8)3,5 4(1) =-—1,2. 


Como |bo| = 0,36 < 1,2 = |bs|, o sis- 
tema é instável. O que é confirmado pe- 
las raízes de Q(z) = 0, que são —0,2513 e 
—1,6244+491,7321. Note que neste exem- 


plo não é necessário calcular b; para apli- 
car o critério de estabilidade. De fato, 
somente é necessário calcular o primeiro 
e o último elementos da última linha do 
arranjo de Jury. 


Exemplo 5.2.4 


Deseja-se refazer o Exemplo 5.2.1, mas 


desta vez resolvendo-o usando o critério 
de Jury, em vez do critério de Routh- 


Hurwitz. Como veremos, a grande van- 
tagem é que não mais é necessário encon- 
trar a equação característica no plano w, 
o que é certamente a etapa mais traba- 
lhosa na maioria dos casos. Portanto, o 
ponto de partida é a equação caracterís- 
tica no plano z (ver Eg. 5.22), a partir da 
qual escrevemos 


Q()=22+(—1,905-+0,00484K )z + (0,905-+0,00468K) = 0. 
(5.27) 


Como se trata de uma equação de se- 
gunda ordem, somente é necessário testar 
as três primeiras condições em (5.26), ou 


seja, 


1+(-1,9054 


9(1) 
0,00468K) 
0,00952K 


(=1)?0(-1) 


+0,00484K) + (0,905 


DR VAR VR 


1—(—1,9054 


-0,00484K) +(0,905-+0,00468K) 
—0,00016K > —3,81 
[0,905 + 0,00468K|<1 .. 


= 6 0 


oe DDR cm (RD cm JR À 


0 
K<23.812,5 
K <20,299. 


Portanto, considerando a primeira e a 
última restrição, chega-se ao mesmo re- 
sultado encontrado em (5.24). 


Exemplo 5.2.5 
A equação característica de um sistema 
é 

Kal - e) 


E CEGO 


=0. (5.28) 


Desejamos aplicar o critério de esta- 
bilidade de Jury para determinar a faixa 
de valores do tempo de amostragem T 
para a qual o sistema é estável, para um 


dado valor de K. Para isso reescrevemos 
5.28) como 


alo) = (fe =" =iLipdeT =0 
Q(z) = e y(Kel -K-1-ez41=0. (5.29) 


Como a equação característica é de 
segunda ordem, ou seja, n = 2, basta 
testar as 3 primeiras condições em (5.26). 


Portanto devemos verificar se 


Ci 
SEO) Sd (5.30) 
[ira 


Começando pela última desigualdade 
em (5.30), temos que 1 < e”, ou seja, 
ni<Ts.To>o, que é um resultado 
esperado. É útil notar que essa restrição 
também pode ser escrita como (e? — 1) > 
0. A primeira desigualdade em (5.30) for- 
nece K(e? — 1) > 0. Como já foi es- 
tabelecido que (e? — 1) > 0, segue que 
K > 0. Por fim, a segunda desigualdade 
em (5.30) resulta em 


E (se == 
(=) > =D= JK 
(o 0) 4 DILIR 


2+K 
gn 1 ines! 
q a(5— ) ( ) 


2 


que estabelece o limite superior para va- 
lores de T, dado um K > 0. Por exem- 
plo, para K = 2,5, a condição (5.31) re- 
quer que T < n9, ou seja, T < 2,197. 
No Exemplo 5.5.3 chegaremos ao mesmo 
resultado utilizando outro procedimento. 


5.3 Análise da Resposta 
em Frequência 


Nas duas subseções anteriores os critérios de 
estabilidade estudados partiam da equação 
característica do sistema e determinavam se 
a mesma tinha alguma raiz fora do círculo de 
raio unitário. Tais métodos tanto se aplicam 
a sistemas em malha aberta — nesse caso a 
equação característica é da malha aberta — 
quanto a sistema em malha fechada. Nesse 
último caso, primeiro é necessário obter a 


função de transferência de malha fechada (ver 
Seção 5.1) e depois testar a equação caracte- 
rística dessa função. 


PR 
Sa 


Nesta seção o ponto de partida é a res- 
posta em freguência de malha do sistema 
amostrado indicado na Figura 5.1, e o teste 
objetiva fornecer a estabilidade do sistema 
em malha fechada. Em particular, começa- 
mos com GH (ei“T7) e desejamos saber se 


Cl). o) 
R(2o) 1+0H() 


(5.32) 


é estável, ou seja se 1+GH(z) = 0 tem raízes 
fora do círculo de raio unitário. 


Em 1932, Harry Nyquist, um pesquisa- 
dor do Laboratório Bell, propôs um mé- 
todo para verificar se a equação caracterís- 
tica de malha fechada para o caso contínuo 
1+ G(s)H(s) = 0 tinha raízes no semiplano 
direito. Ao contrário do teste de Routh- 
Hurwitz, o teste proposto originalmente por 
Nyquist é realizado a partir da resposta em 
frequência de malha G(jw)H(jw), que era as- 
sumida estável. Por conveniência, represen- 
tamos G(jwJH(jw) por GH(jw). A aplica- 
ção do método em si é relativamente simples. 
A seguir fornecemos alguns conceitos neces- 
sários para entender como funciona o crité- 
rio de Nyquist para sistemas contínuos, o que 
permite adaptá-lo ao caso discreto indicado 
por (5.32). 


5.3.1 O princípio do argumento 
de Cauchy 


A fim de facilitar a discussão abordamos ini- 
cialmente o caso contínuo e depois veremos 
que ajustes são necessários para adaptar o 
critério para sistemas amostrados. 

Seja uma função complexa F(s) = 
|F(S)IZF (8) 
K(s—x)(s—22)...(8—zm) 

(s—pi)(s—pa)...(s — pn) 
em que 2;, à = 1,...,m são os zeros de 
F(s)ep; j=1,...,n,0s polose K é uma 
constante (ver Exercício 5.6 e Exercício 5.7). 
Assume-se que F(s) é uma função analítica 
em todo o plano complexo s, a menos de um 
número finito de pontos correspondentes à 
localização dos polos. O valor de F(s) em 
um ponto teste so pode ser determinado gra- 


F(s)= (5.33) 


ficamente a menos de uma constante da se- 
guinte maneira (ver Figura 5.7a): conecta-se 


cada zero e cada polo ao ponto sy por meio 
de segmentos de retas. O módulo e a fase de 
F(so) são dados por 


B1B»...Bm 
|F(so)] = ES E 
AÃS... An 
ZF(so) = 0,+00+...+0mn— bi — P2—...— An, (5.34) 


em que B; e A; são os comprimentos dos seg- 
mentos de reta que unem, respectivamente, 
o i-ésimo zero e o j-ésimo polo ao ponto de 
teste so, e O; e 4; são os ângulos formados 
pelos respectivos segmentos de reta e a semi- 
reta horizontal à direita, como ilustrado na 
Figura 5.7a. O fato de não ser possível deter- 
minar o fator K pelo método gráfico pode ser 
facilmente constatado notando-se que ainda 
que K varie, a localização dos zeros e po- 
los não sofre alteração. Portanto, o procedi- 
mento descrito independe de K. 


FIGURA 5.7: Planos complexos (a) domínio 
e (b) imagem. O número complexo sy no 
plano domínio é mapeado no plano imagem 
para o número complexo F(so), para um caso 
hipotético de um sistema com dois polos e 
dois zeros. 


Uma vez determinado o número complexo 
F(so), que é o valor da função F(s) no ponto 
teste escolhido e indicado por so, o mesmo 
pode ser representado como um ponto em um 
outro plano complexo. Assim, aos planos em 
que se representam os números complexos sg 
e F(so) chamamos de plano domínio e plano 


imagem, respectivamente, como indicado na 
Figura 5.7b. 


Exemplo 5.3.1 


Para ilustrar o que acaba de ser dito, con- 
sidere a função 


2(s+ 0,5) 
2 +2842' 


Pe 
cujos polos e zeros estão indicados na Fi- 
gura 5.8a. Seja um ponto teste so = 0+9, 
indicado na Figura 5.8a. Desejamos en- 
contrar graficamente o valor de F(so). 


Seguindo o procedimento anterior tem- 
se: 


2B ARES 
LF (so)| E = 
Ay Ao v5.1 
Il = 
ZF(so) = G-di-gpo=tg! tg7!2 -0=0. 


(a) (b) 
plano P 


Im 


0,5 di LZF(so)=0 


FIGURA 5.8: Planos complexos (a) do- 
mínio e (b) imagem. O número complexo 
so no plano domínio é mapeado no plano 
imagem para o número complexo F(so). 
A semi-reta B, se sobrepõe a parte da 
semi-reta 4; (pontilhada). O leve desa- 
juste na figura é para facilitar a visuali- 
zação. 


Esse valor, que pode ser facilmente veri- 
ficado numericamente, está indicado no 
plano imagem na Figura 5.8b. 


No que se segue deseja-se investigar que 
traçado é realizado por F(s) no plano ima- 
gem, quando s fizer um traçado específico no 
plano domínio. Para garantir que tal mapea- 
mento seja “bem comportado” assume-se que 
a função F(s) é meromórfica em um certo 
domínio D. Uma função meromórfica em D é 
uma função que é homeomórfica nesse domí- 
nio, com a exceção de um conjunto de pontos 
isolados: os polos. O fato de F(s) ser ho- 
meomórfica em D, exceto nos polos, na prá- 
tica significa que desde que s não passe so- 
bre algum polo, o mapeamento entre o plano 
domínio e o plano imagem é “bem compor- 
tado”. Assim, observando algumas caracte- 
rísticas no plano imagem é possível tirar con- 
clusões sobre a função de mapeamento F(s), 
quando a trajetória percorrida no plano do- 
mínio é conhecida. Como funções expressas 
como a razão de dois polinômios de variá- 
veis complexas são meromórficas em todo o 


plano, podemos lançar mão desse procedi- 
mento “sempre”. 


Se s percorrer um caminho fechado T' no 
plano domínio, a sua imagem F(s)|ser tam- 
bém percorre um caminho fechado, T; no 
plano imagem (ver Figura 5.9). Assume-se 
que T não passa por qualquer zero ou polo. 
Com respeito à fase de F(s), ou seja, ZF(s), 
é possível constatar que se T não enlaça zeros 
ou polos (ver Figura 5.9a), quando s retornar 
ao ponto de partida so, nenhum dos ângulos 
& ou 0; (ver Figura 5.7a) terá acumulado 
uma revolução em torno de si. Portanto, a 
fase ZF(s), que varia ao longo de [;, não 
circula a origem do plano imagem. 


Semelhantemente, se T envolver um zero 
de F(s), quando s tiver percorrido esse ca- 
minho fechado, o ângulo 0, correspondente 
a esse zero terá acumulado uma rotação em 
torno de si, ao passo que os demais ângulos 
0;, 3) + k e todos os ângulos à; não terão 


acumulado rotações em torno de si. Como 
resultado, a fase ZF(s) aumentou 27 — ver 
a segunda equação em (5.34), ou seja, 1; en- 
globou a origem do plano imagem na mesma 
direção de percurso de 7. Por fim, se T en- 
volve um polo de F(s), 7; engloba a origem 
do plano imagem na direção oposta do per- 
curso de T. 


a b 
(8) plano s A plano 1 
Im 


FIGURA 5.9: Planos complexos (a) domínio 
e (b) imagem. Se s percorrer um caminho 
fechado 7 no plano domínio, F(s) percorre 
um caminho fechado T; no plano imagem. 


Esse resultado, conhecido como o princí- 


pio do argumento de Cauchy, pode ser gene- 
ralizado da seguinte maneira: 


Seja Z e P o número de zeros e 
polos, respectivamente, de uma 
função F dentro do contorno T. 
O número de vezes que a origem 
do plano imagem é envolvida por 
ViédadoporN =Z-P.SeN > 
O o sentido de T'; e é o mesmo que 
odeT,ese N <ó0, é contrário. 


A aplicação do princípio do argumento de 
Cauchy é ilustrado na Figura 5.10 para al- 
guns casos simples. 


5.3.2 O critério de estabilidade 
de Nyquist 


Em 1932, Harry Nyquist propôs uma ma- 
neira de aplicar o princípio do argumento 
de Cauchy para determinar a estabilidade de 
sistemas em malha fechada a partir da res- 
posta em frequência de malha. Ou seja, a 
partir de GH(jw) o método permite deter- 
minar se 


C(s)  G(s) 
R(s) 1+GH(s) 


(5.35) 


é estável, conhecendo-se o número de polos 
que GH(s) tem no semiplano direito. A se- 
guir descrevemos o procedimento, que foi de- 
senvolvido para sistemas em tempo contínuo 
e estáveis em malha aberta, e depois vere- 
mos que adaptações são necessárias para sua 
aplicação a sistemas amostrados. 

Seja a função de transferência de malha 


fechada 


Co) Golo) 
R(s) 1+Gp(s)H(s)' 


(5.36) 


cuja equação característica é 1+Gp(s)H(s) = 
0. Começamos usando como função de ma- 
peamento F(s) = 1+Gp(s)H(s), depois isso 
será simplificado. 

O método de Nyquist é composto de três 
elementos fundamentais: o contorno 1 no 
plano domínio, o número de voltas N que o 
contorno T'; envolve a origem do plano ima- 
gem e a função de mapeamento. Nesse mé- 
todo N diz respeito ao número de polos e 
zeros envoltos por I, portanto para que N 
seja útil para fins de estudo de estabilidade, 
P deve contornar uma região do plano do- 
mínio que seja relevante do ponto de vista 
de estabilidade. Assim sendo, escolhemos 
de maneira à contornar todo o semiplano di- 
reito do plano domínio, como mostrado na 


Figura 5.11. Por enquanto consideramos que 
não há polos sobre o eixo imaginário. 
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FIGURA 5.10: O número de voltas de T; 
em torno do plano imagem, conhecido como 
plano F, depende do número de polos e zeros 
envolvidos por " no plano domínio, referido 
às vezes como plano s. 


FIGURA 5.11: T contorna no sentido horário 
o semiplano direito do plano origem. 


Com essa escolha de 1, o número de vol- 
tas N que T; der no plano imagem fornece a 
diferença de zeros e polos da função de mape- 
amento F(s) = 1+Gp(s)H(s), à semelhança 
do que é ilustrado na Figura 5.10. Ou seja, 
tem-se 


N=Z-P, (5.37) 
em que Z e P são, respectivamente, os zeros 


e os os polos de 1 + Gp(s)H(s) envoltos por 
P. Um ponto chave a notar é que os zeros de 


1+Gp(s)H(s) são as raízes da equação carac- 
terística em malha fechada, ou seja, os polos 
de malha fechada. A fim de interpretarmos 
os polos de 1 + Gp(s)H(s), reescrevemos esse 
polinômio característico como: 


Ne(s) Nu(s) 

De(s) Du(s) 

— De(s)Du(s) + Ne(s)Na(s) 
De(s)Du(s) 


1+Gp(s)H(s) = 14 


, (5.38) 


em que Ngu(s) e Den(s) foram utiliza- 
dos para indicar os polinômios do numera- 
dor e denominador, respectivamente. Como 
pode ser visto de (5.38), os polos de 1 + 
Gp(s)H(s) são os valores de s para os quais 
De(s)Du(s) = 0, ou seja, são os polos de 
malha aberta. Portanto concluímos que: 


1. Z indica o número de zeros de 1 + 
Gp(s)H(s) que é o número de polos em 
malha fechada no semiplano direito, e 


2. P indica o número de polos de 1 + 


Gp(s)H(s) que é o número de polos em 
malha aberta no semiplano direito. 


Com esses elementos, é possível divisar o 
seguinte critério. Assumindo que o sistema 
em malha aberta é estável, então P = 0, 
para que o sistema em malha fechada seja 
estável devemos ter Z = 0 — ou seja à ma- 
lha fechada não deve ter polos no semiplano 
direito —, portanto (ver Eq.5.37) N = 0, ou 
seja, 7; não deve envolver a origem do plano 
imagem. Esse é, em essência, o critério de es- 
tabilidade de Nyquist. Antes de apresentá-lo 
na forma com que o mesmo é conhecido, fa- 
zemos algumas observações. 


1. Em vez de usar F(s) = 1 + Gp(s)H(s) 
e contar o número de revoluções de T; 
em torno da origem do plano imagem, 
usa-se F(s) = Gp(s)H(s) como função 
de mapeamento e conta-se o número 
de revoluções de T'; em torno do ponto 
(—1,70) no plano imagem. 


2. VP é simétrica no plano domínio e tam- 
bém T; o é no plano imagem. Portanto, 
somente uma metade de T" e TP; é nor- 
malmente considerada. 


3. Assumindo que F(s) = Gy(s)H(s) é 
passa baixas, o que é geralmente verda- 
deiro para sistemas causais, o semicír- 
culo de raio infinito no plano domínio é 
mapeado para a origem do plano ima- 
gem (ver Exercício 5.7). Logo, a parte 
do contorno 1 que interessa investigar 
na prática é 


DM=(s=o+julo=-0€0<w<wmaxh (5.39) 


Ou seja, o “contorno” no plano domí- 
nio pode ser restrito ao semieixo ima- 
ginário positivo. Nesse caso, no plano 
imagem tem-se 


PM = Gp(s)H(s),er+ 
= Gplju)H(jw). (5.40) 


4. Se o número de polos de malha aberta 
no semiplano direito — circundados por 


P — P é conhecido a priori não é neces- 
sário, como fez Nyquist em 1932, supor 
que o sistema em malha aberta é está- 
vel. 


Antes de resumir o procedimento proposto 
por Nyquist, devemos considerar o impor- 
tante caso de o sistema ter polo sobre o eixo 
imaginário. A Figura 5.12 mostra o caso de 
haver um polo no plano s, o plano domí- 
nio. Como o caminho T não pode passar por 
polo, o traçado ilustrado na Figura 5.11 não 
pode ser utilizado. Em vez disso, T desvia 
do polo formando uma semicircunferência de 
raio muito pequeno, como mostrado na Fi- 
gura 5.12a. 


plano 
domínio 


plano 


FIGURA 5.12: Detalhes do caminho T; no 
plano imagem quando o sistema tem polo so- 
bre o eixo imaginário; (a) traçado no plano 
domínio, e (b) respectivo traçado no plano 
imagem. 


Para compreender o que ocorre, marca- 
mos três pontos sobre 7 em torno do polo 
na origem. Esses pontos estão indicados por 
So, $S1 € 89. O ponto no plano imagem cor- 
respondente a so é F(so) e pode ser obtido 
seguindo o procedimento resumido em (5.34). 
A distância entre o polo e o ponto de teste 


éreafaseé 90º ou 7/2 rad (note que a 
linha que liga o polo a sy é uma reta vertical 
para cima). Como se trata de um polo, a dis- 
tância aparece no denominador de F(so) e a 
fase aparece com o sinal invertido, como visto 

m (5.34). Portanto, temos que F(so) = 
IZ — 1/2. Portanto, a contribuição desse 
polo para o diagrama polar é tal que seu iní- 
cio é no —oo, pois r — 0, no sentido vertical 
para baixo, pois a contribuição para a fase é 
—1/2. Isso está mostrado na Figura 5.12 b, 
onde está indicado que o gráfico polar inicia 
no —oo na direção do eixo imaginário. 


[m] pis [ml] 
E 


Eos 


O mesmo raciocínio deve ser aplicado a s; 
e so. Para s; temos o caso de sy só que para 
fase 7/2 e em sa a contribuição do polo para 


a fase é zero. O pontilhado na Figura 5.12b 
indica que a transição da imagem de sy para 
a de so se dá pelo infinito. 

Raciocínio equivalente vale para o caso 
em que haja polos complexos conjugados so- 
bre o eixo imaginário, bem como para o caso 
discreto em que haja um polo em z = 1. 
Deve ser notado que localmente o desenho 
mostrado na Figura 5.12a não muda se o 
plano domínio fosse o plano z e o polo es- 
tivesse em z = 1. Portanto, as principais 
conclusões ilustradas na na Figura 5.12b per- 
manecem válidas. Esse ponto para o caso 
discreto é ilustrado no Exemplo 5.3.3 (veja 
também a Figura 5.17). A seguir discutimos 
um exemplo para um sistema em tempo con- 
tínuo com um polo na origem. 


Exemplo 5.3.2 


Seja a função de transferência de malha 


de um sistema contínuo 


1 


Cn) — GE 


(5.41) 

Como GH(s) tem um polo em s = 0, 
diz-se que é do tipo 1. No caso discreto, 
funções de transferência tipo r têm r po- 
los em z = 1. O caminho T no plano 
domínio e o diagrama polar de GH(jw) 
estão mostrados na Figura 5.13 


plano 
domínio 


FIGURA 5.13: Detalhes do caminho T'; 
no plano imagem para (5.41): (a) tra- 
çado no plano domínio, e (b) respectivo 
traçado no plano imagem. 


Note que as principais características 
em baixas frequências das figuras 5.13b 
e 5.12b foram mantidas. O início do di- 
agrama polar de todo sistema tipo 1 co- 
meça no —oo “na direção do eixo imagi- 
nário”. 


Portanto, podemos resumir a aplicação 


do critério de Nyquist como: 


1. faça o diagrama polar, conhecido 
também como diagrama de Nyquist, 
da resposta em frequência de malha 
Goljw)H(jw). Esse traçado é T; (veja 
Eq. 5.40); 


2. conte o número de vezes que o referido 
diagrama circula o ponto (—1,70) no 
sentido horário. Chame esse número 
de N. Caso o número líquido de en- 
volvimentos do ponto (—1,70) seja no 
sentido anti-horário, o valor de N é ne- 
gativo, pois 7 é percorrido em sentido 
horário, no plano domínio; 


3. supõe-se que o número de polos da fun- 
ção de transferência de malha no semi- 
plano direito, P, é conhecido. Deter- 
mine Z = N+P, que é o número de 
raízes da equação característica em ma- 


lha fechada no semiplano direito. Por- 
tanto, se Z £ 0, o sistema em malha 
fechada é instável. 


5.3.3 O critério para sistemas 
discretos 


Desejamos agora adaptar o critério de esta- 
bilidade de Nyquist para sistemas amostra- 
dos ou discretos. Ou seja, queremos aplicar 
o princípio do argumento de Cauchy (ver Se- 
ção 5.3.1) para o caso 


C*(s)  G*(8) 
els) 14GH*8) 


em que G*(s) inclui a função de transferência 
do segurador de ordem zero, Z0H. O caso 
discreto correspondente é 


C(z) G(z) 


R(2) 1+6H(5) 


A Figura 5.14 mostra os contornos T para 
o caso amostrado e para o caso discreto. O 
caso amostrado é muito parecido como o caso 
abordado na Seção 5.3.2 e não é repetido. O 
caso de interesse imediato é o discreto, para 
o qual T está mostrado na Figura 5.14b. 

Lembre-se que z = 1 corresponde a w = 0 
ez = —1 corresponde à máxima frequência 
representável, ou seja, w = ws/2. Assim, a 
primeira observação é que 1 no caso discreto 
é uma curva fechada que é percorrida no sen- 
tido anti-horário, ao contrário do caso con- 
tínuo. Portanto, no plano imagem GH(z), 
N = Z — P corresponde ao número de envol- 
vimentos do ponto (—1, 40) na mesma dire- 
ção de T, ou seja, anti-horária; Z e P são os 
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FiGURA 5.14: Contornos T para o caso 
(a) amostrado, e (b) discreto. 


zeros e polos de 1 +GH(z) dentro do círculo 
de raio unitário, respectivamente. É conveni- 
ente representar esses valores por Za e Pa, em 
que o subescrito ressalta o fato de que esta- 
mos contando zeros e polos que são envoltos 
por VP. 


A fim de mexermos o mínimo possível no 
procedimento desenvolvido para o caso con- 
tínuo, desejamos, também no caso discreto, 


contar envolvimentos do ponto (—1,70) no 
sentido horário. Para isso fazemos inverte- 
mos o sinal algébrico de N, ou seja, usare- 
mos N = P4 — Za. Contudo, como no caso 
contínuo, desejamos conhecer o número de 
polos de malha fechada na região de instabi- 
lidade, ou seja, que estão fora do círculo de 
raio unitário. Para resolver esse problema, 
chamando de n o número de polos de GH(z), 
percebe-se (veja Eq. 5.38) que 1 + GH(z) é 
uma razão de dois polinômios de grau n. Por- 
tanto podemos escrever as relações 


P+P=n, e Za+tZ=n, 
em que os subescritos referem-se a dentro e 
fora de T. Portanto, PA = n-— Pe Za = 
n — Zs o que resulta em 

No = P-Za=(n—-P)-(n-— Ze) 

Ze — Pr, (5.42) 

que corresponde ao critério para o caso contí- 
nuo. Portanto, no caso discreto, deve-se tra- 


çar a resposta em frequência de malha aberta 
GH(e'“T) para a faixa de frequências O < 
wT <7 e, a seguir, contar o número N de ve- 
zes que esse traçado envolve o ponto (—1,50) 
no sentido horário. 

Outra maneira de entender que, na rea- 
lidade não houve mudanças com respeito ao 
caso contínuo, é imaginar uma formiga ca- 
minhando sobre o círculo de raio unitário no 
sentido anti-horário, ou seja, percorrendo T. 
Note que para essa formiga, os “polos instá- 
veis” estão sempre à sua direita, como ocorre 
no caso contínuo. 


E CP) 


Exemplo 5.3.3 


Seja a função de transferência de malha 
de um sistema com T" = 1 
feel 0,42 + 0,3 


Ho neos (643) 


Desejamos investigar a estabilidade desse 
sistema em malha fechada e, para isso, 
começamos esboçando o diagrama polar 
da respectiva resposta em frequência 


0,4e7 + 0,3 


E em (04 


variando a frequência na faixa O < w < 
ws/2. Como T = 1, tem-se que w, = 27. 
Os dados usados para gerar o diagrama 
mostrado na Figura 5.15 foram gerados 
pelo seguinte código Matlab: 


num=[0.4 0.3]; 

den=conv([1 -1],[1 -0.4]); 

T=1; ) período de amostragem 
sys=tf (num,den,T); 

N=100; 

% 100 valores de w entre 0,1 e pi 
w=logspace(-1,pi,N); 

% gera dados para o diagrama polar 
[re, im]=nyquist(sys,w); 


O valor sobre o eixo real indicado pela 
seta na Figura 5.15 corresponde a w = 
m.z=e" =-l, portanto 


-0,0357 


Im 
o 
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FIGURA 5.15: Diagrama polar de 
GH(eT). Em traço contínuo estão os 
valores para 0,32 < w < 7. À parte tra- 
cejada corresponde à faixa de frequências 
—T<w<—OO,S2. 


Como a função de transferência de 


malha (5.43) não tem qualquer polo fora 
do círculo de raio unitário, P = 0, além 
disso, pela Figura 5.15 vê-se que o ponto 
-1 não é envolto pelo diagrama polar, ou 
seja, N = 0. Por fim, tem-se Z = N + 
P = 0, ou seja, o número de zeros da 
equação característica fora do círculo de 
raio unitário também é zero. Como os 
zeros de 1 + GH(z) = 0 são os polos em 
malha fechada, o sistema realimentado é 
estável. O critério de Nyquist assume 
que o valor de P é conhecido a priori. 
Se o sistema é estável em malha aberta, 
então P = 0. 


Exemplo 5.3.4 


Voltemos a considerar a função de trans- 
ferência (5.43), mas agora com um pos- 


sível ganho variável em função de K': 


E 0,42 + 0,3 
= JN E 
CO E SNCETo 


O respectivo sistema em malha fechada 
tem, portanto, a seguinte equação carac- 
terística: 


1+GH(2)=Q(2)=22+(0,4K—1,4)2-+0,4-+0,3K=0. 


Aplicando o critério de Jury, chega- 
mos às seguintes condições para a esta- 


bilidade da malha fechada: 


po O oi 
(-12Q(-1) >0, -0,1K >28...K < 28 
WA COsKk<1 Ka? 
ou seja, O < K < 2 é condição para que 


a malha fechada seja estável. No Exem- 
plo 5.3.3 o valor do ganho (K = 1) está 


dentro dessa faixa, portanto o sistema em 
malha fechada é estável. O fator pelo 
qual se deve multiplicar o ganho para 
atingir o limite de estabilidade é a mar- 
gem de ganho. Assim, no Exemplo 5.3.3 
a margem de ganho é 2, pois se GH(z) for 
multiplicado por esse valor, o diagrama 
polar cruzará o eixo real no ponto —1, 
ou seja, o diagrama da Figura 5.15 cruza 
o eixo real no ponto —0,5. 


Exemplo 5.3.5 


Seja a função de transferência de malha 
de um sistema discreto com T = 1, que 
é instável 


O diagrama polar de GH (e!“7) é mos- 
trado na Figura 5.16. Como existe um 
polo de malha aberta fora do círculo de 
raio unitário, P = 1. Como GH (e'“) en- 
volve o ponto (—1,70) uma vez no sen- 
tido anti-horário, tem-se N = —1, logo 
da relação N = Z — P vemos que Z = 0, 
indicando que o sistema em malha fe- 
chada é estável. De fato, o sistema em 
malha fechada tem um polo em z = 0,1. 


Im 
; 
[e] 
ei] 


FIGURA 5.16: Diagrama polar de 
GH (e) em (5.45). 


Os valores sobre o eixo real corres- 
pondem aw = 0ew = ws/2 e podem ser 


determinadas a partir de (5.45) como 


q 
E: 
| 
| 


valores esses que podem ser facilmente 
verificados na Figura 5.16. 


5.3.4 Um esclarecimento 


Um ponto que pode gerar dúvida refere-se ao 
fato de a função de mapeamento ser a fun- 
ção de transferência de malha aberta. Nesse 
caso não deveríamos associar Z e P a zeros 
e polos dessa função, em vez de associá-los à 
equação característica, como exige o critério 
de estabilidade de Nyquist? 

Possivelmente a maneira mais clara de 
responder a essa questão seja supor que dese- 


jamos fazer a análise correspondente à mos- 
trada na Figura 5.10 para a função de trans- 
ferência de malha. Essa análise consiste em 
realizar os passos descritos na página 4083. 

Como a função de mapeamento é a res- 
posta em frequência de malha, a fim de reali- 
zar a análise ilustrada na Figura 5.10, basta 
fazer as duas seguintes alterações ao proce- 
dimento do critério de Nyquist descrito na 
página 403: 


1. no passo 2, em vez de contabilizar o nú- 
mero de envolvimentos no sentido ho- 
rário do ponto (—1,70), deve-se atri- 
buir a N o número de envolvimentos 
no sentido horário da origem do plano 
imagem, ou seja, do ponto (0,70): 


2. a análise diz respeito à função de ma- 
peamento, ou seja, no passo 3, equação 
característica deve ser substituída por 
função de transferência de malha. 


O próximo exemplo ilustra os detalhes do 
que acabamos de explicar. 


Exemplo 5.3.6 


Neste exemplo voltamos a considerar a 
função de transferência de malha mos- 
trada em (5.43). Em vez de procurar res- 
ponder se o sistema em malha fechada 
é estável, desejamos fazer a análise de 
fase de Cauchy ilustrada na Figura 5.10. 
Para isso seguiremos os passos do proce- 
dimento descrito na página 403 com as 
alterações mencionadas anteriormente. 
O passo 1 consiste em fazer o digrama 
polar da resposta em frequência de ma- 
lha. Isso foi feito no Exemplo 5.3.3 e está 
mostrado na Figura 5.15 e, esquematica- 
mente, na Figura 5.17. O passo 2 cor- 
responde a contar o número de envolvi- 
mentos no sentido horário da origem do 


plano imagem mostrado naquela figura. 
Portanto N = 1 (ver Figura 5.17 para 
detalhes). 


w— 0+ 


FIGURA 5.17: Representação do 
diagrama polar detalhado da fun- 
ção de transferência de malha 


GH(z) da Eq. 5.43. 


Prosseguimos a análise observando que 
a função de transferência de malha mos- 
trada em (5.43) não tem qualquer polo 


fora do círculo de raio unitário, portanto 
P = 0. Portanto, o que pode ser con- 
cluído sobre a função de transferência de 
malha GH(z) é que Z =1+0=1,ou 
seja, a mesma tem um zero fora do cír- 
culo de raio unitário. 

Apesar de correto, esse resultado pode 
causar estranheza à primeira vista. Con- 
tudo, deve ser lembrado que uma função 
racional com polinômios de numerador e 
denominador, respectivamente, com graus 
men,m <n tem m zeros finitos e n po- 
los finitos, mas tem também n — m zeros 
infinitos. Portanto, a função de transfe- 
rência de malha mostrada em (5.43) tem 
dois zeros: um em z = —3/4 e um no in- 
finito. Esse último zero, claramente está 
fora do círculo de raio unitário e, por- 
tanto, Z = 1 é a resposta correta. 


5.3.5 Margens de ganho e de fase 


O critério de Nyquist fornece um meio de 
verificar a estabilidade da malha fechada a 
partir do traçado do diagrama polar da res- 
posta em frequência de malha GH (e'“7) e da 
informação do número de polos que GH (2) 
tem fora do circunferência de raio unitário, 
ou seja, “polos instáveis”. Uma das vantagens 
desse procedimento é que permite constatar 
visualmente se um sistema em malha fechada 
estável está próximo ou não a tornar-se ins- 
tável. 

Considere o diagrama polar mostrado na 
Figura 5.18. Há duas formas de tornar a 
malha fechada instável por meio de “ma- 
nipulações” simples. A primeira é afastar 
cada ponto do diagrama polar da origem por 
um fator K. Isso corresponde a multipli- 
car GH(ei“) por K. Assim, em qualquer 
frequência que se queira considerar, digamos 
wo, O ponto no novo diagrama está a uma dis- 


tância |K GH (eivo7)| da origem. Para algum 
valor de K crítico, o diagrama cruza o eixo 
real negativo no ponto —1. Nessa condição 
diz-se que o sistema em malha fechada está 
no limite de estabilidade. Se K aumentar 
mais um pouco, isso é suficiente para que o 
diagrama circunde o ponto —1 e, assumindo 
que a malha aberta é estável, leva a ma- 
lha fechada à instabilidade. Intuitivamente, 
pensando apenas no aspecto de estabilidade, 
quanto maior for o valor de K crítico melhor, 
pois isso significa que a malha está mais longe 
de se tornar instável. Nesse caso dizemos que 
a margem de ganho é “srande”. Portanto, 
define-se margem de ganho como: 


MG = |GH (e'oT)|-1 tal que 


LGH(eoT) = 180º. (5.45) 


FIGURA 5.18: Diagrama polar em que são 
definidas a margem de ganho (MG) e a mar- 
gem de fase (MF). 


A segunda maneira de atingir o limite 
de estabilidade, também chamado de esta- 
bilidade marginal, é girar o diagrama polar 


no sentido horário. Ao proceder dessa ma- 
neira, o ponto do diagrama que tiver mó- 
dulo unitário, ou seja, o ponto para o qual 
IGH(ei»T)| = 1, toca o ponto —1 atingindo 
assim o limite de estabilidade. O ângulo pelo 
qual o diagrama deve ser girado para atingir 
o limite de estabilidade é a margem de fase. 
Formalmente, define-se: 


MF = 180º + ZGH (eivo7) tal que 
IGH(eoD)| —1. (5.46) 


Pela definição de MG, nota-se que nor- 
malmente à medida que se aumenta o ga- 
nho de malha, o sistema controlado a mar- 
gem de ganho reduz, indicando que este se 
aproxima de uma condição de operação ins- 
tável. É importante perceber que a inclusão 
de um atraso de transporte na malha tem 
o efeito de girar o diagrama no sentido ho- 
rário. Nesse caso, como a fase depende da 
frequência, cada ponto do diagrama gira de 


uma certa quantidade. Portanto, usando o 
conceito de margem de fase, é possível cons- 
tatar o conhecido fato de que quanto maior 
for o atraso de tempo de uma malha de con- 
trole, mais próximo está de tornar-se instá- 
vel. Logo, as margens de ganho e de fase 
são medidas de robustez do sistema de con- 
trole. Valores “grandes” dessas margens in- 
dicam que o sistema pode sofrer certas mu- 
danças e a malha fechada permanece estável. 


5.4 A Carta de Nichols 


No início deste capítulo vimos como deter- 
minar à função de transferência em malha fe- 
chada de um sistema amostrado. Se escolher- 
mos H(s) = 1 no diagrama de blocos mos- 
trado na Figura 5.1, a função de transferência 


de malha fechada torna-se (ver Eq. 5.6) 


CS) E) 

Rr(s) 1+ Gr(s) 

C(2)  G(2) 

no ro MU 


A resposta em frequência do sistema con- 
trolado, ou seja, do sistema em malha fe- 
chada é 


C(eeT) — G(eim) 
R(T) IH) 


(5.48) 


Da expressão (5.48) constata-se que a res- 
posta em frequência do sistema em malha fe- 
chada depende da resposta em frequência de 
malha que, como H (ei) = 1, coincide com 
a de ramo direto, ou seja, G(e!“7). Dessa ob- 
servação decorre que é possível ter um pro- 
cedimento simples pelo qual a função (5.48) 
pode ser esboçada a partir de G(e'27) sem 


ter que efetivamente fazer a operação mate- 
mática implícita em (5.48). Isso é investigado 
nesta seção. 


Elisa] 


Es 


5.4.1 Representação de G(e'“?) 


Uma maneira comum de representar a fun- 
ção G(ei“T) é usando o plano complexo (Fi- 
gura 5.19). Nesse caso referimo-nos ao resul- 
tado como o diagrama polar de G(e'T) ou 
ainda o diagrama de Nyquist de G(e/“7). 
Outra maneira de representar G(e'“7) é 
localizar a fase ZG(e!“7) no eixo das abcis- 
sas e 20 10819 |G(e!“7)| no eixo das ordenadas. 
As unidades nos eixos são graus e dB, respec- 
tivamente, como ilustrado na Figura 5.20. 


FIGURA 5.19: Representação do diagrama 
polar de G(eiv7), 


A resposta em frequência G(e!“T) tanto 
no diagrama polar (Figura 5.19) como no di- 
agrama ganho-fase (Figura 5.20) é uma fun- 
ção parametrizada pela frequência w, ou seja, 
o valor de w “corre ao longo” dos diagramas. 


FIGURA 5.20: Diagrama ganho em dB-fase 
em graus de G(eleT), 


5.4.2 Círculos M e N 


Na Figura 5.19 foi marcado um ponto hipoté- 
tico no qual o valor de frequência é w,. Por- 
tanto, a resposta em frequência nesse ponto 
G(ei17) é indicada pelo vetor que liga a ori- 
gem a esse ponto. Tal vetor tem módulo 
|G(ei17)| e fase —a. O vetor 1 + G(eivT) 
também está indicado nessa figura. O va- 
lor da resposta em frequência do sistema em 


malha fechada na frequência w, é dada pela 
razão desses vetores (ver Eq. 5.48), ou seja, 


ef Jales 


R(cinT) |1+G(einTeib 
= Melo) =Mei?, (5.49) 


em que M e q indicam, respectivamente, o 
ganho e a fase da resposta em frequência em 
malha fechada na frequência wy. 

Desejamos agora determinar que pontos 
no plano complexo associados à malha aberta 
correspondem a ganho constante em malha 
fechada. Para isso, começamos indicando um 
ponto qualquer no plano complexo por X + 
9Y. Esse ponto define um vetor que tem iní- 
cio na origem do plano e termina no referido 
ponto. Portanto pode-se escrever: 


X+jY =|X+jY|e” (5.50) 
| x 
=VX24Y2e7, y=tan! (x) ; 


Associamos esse ponto à resposta em 
frequência em malha aberta, ou seja, X + 
jY = G(eii7). Substituindo essa relação 
em (5.49), e tomando o quadrado do módulo, 
temos: 


Ne e 


Mº = 
(1+X)2+Y? 


(5.51) 


Deve ser notado que (5.51) refere-se a in- 
formação de malha fechada. Em linhas ge- 
rais, o objetivo passa a ser encontrar os valo- 
res de X eY (da resposta em frequência de 
malha) tais que M (da resposta em frequên- 
cia em malha fechada) seja constante. Ou 
ainda, dado um valor de M, desejamos en- 
contrar os valores de X e Y que satisfazem 
(5.51). Para ver isso mais claramente, rees- 
crevemos (5.51) como 


(Mº -DX2º+MQXAD+AH(M?-1)Y2=0, (5.52) 


ou ainda 


M2 7? M? 
[x | | Fy2 = MAI, (5.53) 


M2-1 


que é a equação de um círculo com 
raio r = IM((Mº — D| e centrado em 
X=-Mº(Mº-1)2eY =0. Da Eq.5.52 
pode ser visto que para M = 1 tem-se X = 
—1/2. Círculos M para alguns valores de M 
são mostrados na Figura 5.21, sendo que em 
geral o eixo das ordenadas pode ser calculado 
a partir do valor da abcissa e de M por 


—(M2-1)X2-M2(2X+1) 
Y= +) 07) (5.54) 


Um círculo M na Figura 5.21 é um lugar 
geométrico da resposta em frequência de ma- 
lha aberta que, em malha fechada, resulta no 
mesmo ganho. Isso ficará mais claro quando 
discutirmos um exemplo. 


Im 
o 


FigurA 5.21: Círculos M no plano com- 
plexo X +jY = G(ele7), 


Assim como os círculos M indicam o lu- 
gar geométrico no plano complexo nos quais 
a resposta em frequência de malha fechada 
(5.49) tem ganho (módulo) constante é in- 
teressante inquirir qual é o lugar geométrico 


correspondente a fase constante. Como visto 
a seguir, esse lugar geométrico também é for- 
mado por círculos. Em (5.49) fizemos à = 
a — 8, logo: 

d=a-B=/G(d1D) - 21 +G(edD (5.55) 
No desenvolvimento a seguir usamos a rela- 
ção trigonométrica 

tana +tan 5 


tan(a + 5) = EST (5.56) 


Como antes, se expressarmos a resposta 
em frequência de malha em coordenadas re- 
tangulares X +jY = G(eiT), (5.55) pode 
ser reescrita como 


d=tan! (x) =tan”! (==) » (5.57) 


portanto, usando (5.56) tem-se 


voy 
N=tanó= A HÃO (5.58) 
Loc 


de onde é possível obter que X2 + X +Y? — 
Y/N =0,ou 


que é a equação de um círculo com 


raio 1+ (o e com centro em 
(X,Y) = (—1/2,1/2N), como mostrado 
na Figura 5.22. 


asi NE 
REA 
AE 


tao co 
4 


Re 


FiGURA 5.22: Círculos N = tan ó no plano 
complexo X + jY = G(eiv). 


Um ponto fundamental a perceber é que 
os círculos M e N relacionam a resposta em 
frequência de malha com a correspondente 
resposta em frequência de malha fechada. Por 
exemplo, se a resposta em frequência de ma- 


lha G(e'“7) interceptar o círculo M corres- 
pondente ao valor de ganho 2 na frequência 
wo e nessa frequência interceptar o círculo N 
de fase —45º, então a malha fechada satisfaz 
a relação 


C(eivoT) o G(eivoT) 
R(eiwoT)  1+G(ejwol) 
= Ze Í7/A, (5.60) 


Na prática, os círculos M e N são úteis 
para fornecer rapidamente relações em ma- 
lha fechada, a partir de informação em malha 
aberta. 


IGH| dB 


-240º -210º —180º —-150º —120º -90º  —60º  —30º 
/GH 


FIGURA 5.23: Carta ou ábaco de Nichols 
para H(ePj=1, 


Uma ferramenta de projeto que se tornou 
popular a partir da Segunda Guerra Mun- 
dial, representa um conjunto de círculos M 
e N no diagrama de ganho em dB-fase em 
graus. O ábaco resultante ficou conhecido 
com Carta de Nichols (Figura 5.23). An- 
tes de descrever e ilustrar o uso dessa carta, 
é importante notar que o lugar geométrico 
de ganho constante M e fase constante N 
não são círculos no diagrama de ganho-fase, 
mas somente no plano complexo. Na carta 
de Nichols, veja a Figura 5.23, os círculos M 
tornaram-se as curvas indicadas por ganhos 
em dB. Semelhantemente, os círculos N são 
as curvas indicadas por fase em graus. 


O uso da carta de Nichols começa com o 
traçado da resposta em frequência em malha 
aberta G(ei“T). Para isso, ignora-se o ábaco 
formado pelos lugares geométricos de ganho 
e fase constantes, e faz-se o traçado usando os 
eixos de ganho em dB e fase em graus. Uma 


vez feito o traçado, a resposta em frequência 
em malha fechada C(e'“D) / R(ei“T) pode ser 
lida diretamente das interseções de G(e'7) 
com os “círculos” M e N. Deve-se lembrar 
que os resultados desta seção pressupõem que 
o ramo de realimentação é unitário. O caso 
em que isso não se verifica é tratado na Se- 
ção 9.4.3. 


Na carta de Nichols o ponto (-180º,0 dB) 
é fundamental. Depois de traçado o gráfico 
de G(ei“7), a distância vertical entre a res- 
posta em frequência e esse ponto é a margem 
de ganho, sendo que a margem é positiva se 
G(ei«“T) passar abaixo de (-180º, 0 dB), note 
que nesse caso o ganho de malha é menor que 
1. A margem de fase é a distância horizontal 
de G(e'“7) ao ponto (-180º,0 dB), sendo que 
para uma margem de fase positiva, é compul- 
sório que a resposta em frequência passe à di- 
reita do ponto, indicando que a fase G(e!“7) 
ainda não chegou a -180º. 


Há outras duas medidas importantes ob- 
tidas da carta de Nichols. O círculo M de 
maior ganho tangente a G(ei“T) indica o 
maior ganho (por exemplo o pico de res- 
sonância, M,, quando houver) do sistema 
em malha fechada. Esse ganho ocorre na 
frequência w na qual G(e!“7) tangencia o cír- 
clo M. 

Por fim, assumindo que o sistema em ma- 
lha fechada tem ganho CC unitário, a frequên- 
cia na qual G(ei“7) cruza o círculo M de va- 
lor -3dB é a banda de passagem do sistema 
em malha fechada. Lembre-se que a banda de 
passagem é definida como a faixa de frequên- 
cias O < w < wp, sendo que w, é a frequên- 
cia para a qual G(e'+7) está 3dB abaixo de 
G(e7). Esses resultados são ilustrados no 
próximo exemplo. 


[n] £3 [m] 
Fa 


Exemplo 5.4.1 


Voltamos a usar a função de transfe- 
rência de malha que foi considerada no 
Exemplo 5.3.3 


0,42 + 0,3 


ds GEO) 


(5.61) 


em que, sem prejuízo, assumimos que 
toda a dinâmica está no ramo direto. A 
resposta em frequência G(e!º) (T = 1) 
é mostrada na carta de Nichols na Fi- 
gura 5.24. 
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FIGURA 5.24: Carta de Nichols para 
a função de transferência de malha em 


(5.61). 


A margem de ganho é a distância em 
dB entre a resposta em frequência e a 
cruz, que no caso da Figura 5.24 é apro- 


ximadamente MG= 6,5dB. A margem 
de fase é MF= 30º, pois essa é aproxi- 
madamente a distância em graus que a 
resposta em frequência está à direita da 
cruz. O círculo M de maior ganho a tan- 
genciar a resposta em frequência não está 
indicado, mas é nítido que tem ganho su- 
perior a 6dB. Por fim, a frequência para 
a qual G(e'“) cruza o círculo M de ga- 
nho -3dB é wp = 1,3rad/s — não indi- 
cada no gráfico, pois a frequência corre ao 
longo do traçado de G(e'”). Os valores 
de frequência não estão indicados na Fi- 
gura 5.24, portanto essa informação deve 
ser obtida do programa utilizado para o 
traçado de G(e!“) no gráfico. 

As margens de ganho e de fase po- 
dem ser facilmente verificadas traçando- 
se o diagrama de Bode de G(e!º) e pro- 
cedendo como de costume. A fim de ve- 
rificar os outros resultados, calculamos 


a função de transferência em malha fe- 
chada, que é 
Clip Gl 042403 
R() GR 2 AO 


(5.62) 


cuja resposta em frequência está mostrada 
na Figura 5.25. 
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FIGURA 5.25: 


Frequency (rad/s) 


Resposta em frequência 


para o sistema em malha fechada dado 


em (5.62). 


Do gráfico na Figura 5.25, o pico de 
ressonância M, tem magnitude acima de 
8dB. Da análise da carta de Nichols sa- 


bíamos que seria maior que 6dB. Além 
disso, o aspecto pronunciado dessa res- 
sonância é consequência da margem de 
fase relativamente pequena MFx 30º, ou 
seja, o sistema apresenta respostas tem- 
porais bastante oscilatórias. Por fim, a 
banda de passagem pode ser lida dire- 
tamente da Figura 5.25, procurando a 
frequência para a qual o diagrama de mag- 
nitude atinge o valor -3dB. O valor en- 
contrado é wp = 1,3rad/s, como encon- 
trado pela carta de Nichols. 


5.4.3  Realimentação não 
unitária 

No caso em que o ramo de realimentação não 

é unitário, como indicado na Figura 5.26a, 


a carta de Nichols pode ser utilizada usando 
um procedimento que implicitamente descreve 


o sistema como na Figura 5.26b, em que o 
ramo de realimentação é unitário (Castrucci 
et al., 2011, p. 192). Para isso: 


FIGURA 5.26: Diagramas de bloco equiva- 
lentes. 


1. trace a resposta em frequência 
G(ei“7) H (e“7) na carta de Nichols; 


2. dessa carta obtenha O(eiD) /R(eie7); 


3. trace o diagrama de Bode de E 


de 1/H(eieT); 


e 


4. some os diagramas de Bode obtidos no 
item anterior. 


Exemplo 5.4.2 


No presente exemplo desejamos respon- 
der a seguinte pergunta: quão grave é 
desprezar a dinâmica do ramo de reali- 
mentação se ela for mais rápida que a di- 
nâmica da planta? Para isso considerare- 
mos que função de transferência de ramo 
direto é (5.61) para dois sistemas. Além 
disso, um sistema tem realimentação uni- 
tária, enquanto o outro tem função de 
transferência do ramo de realimentação 


0,7 


Ea E=U0] 


(5.63) 

A Figura 5.27 mostra os diagramas 
de Bode para ambos os sistemas em ma- 
lha fechada. Como ambos os os sistemas 
têm função de transferência de malha do 
tipo 1, o ganho CC é unitário, o que cor- 
responde a 0dB (por quê?). Note que as 
respostas em frequência estão definidas 
somente até a frequência 7, que corres- 
ponde a ws/2, portanto T = 1s. 

Comparando as curvas na Figura 5.27 
é possível concluir que até 10% da frequên- 
cia de amostragem (0,1 Hz ou 0,628 rad/s) 
a coincidência das curvas de módulo é 
boa, mas a fase apresenta uma diferença 
de aproximadamente 30º. 


ganho (dB) 


102 101 10º 10! 
w (rad/s) 


fase (graus) 


102 101 10º 10! 
w (rad/s) 


FIGURA 5.27: Diagramas de Bode de sis- 
temas em malha fechada. O traço con- 
tínuo corresponde ao sistema com reali- 
mentação não unitária H(z) em (5.63) ao 
passo que a resposta em traço-ponto cor- 
responde ao sistema com realimentação 
unitária. 


5.5 O Lugar das Raízes 


Os polos de uma função de transferência de- 
terminam grande parte da sua resposta tem- 
poral. Portanto, qualquer parâmetro que al- 
terar o posicionamento dos polos no plano z 
afeta a resposta temporal e em frequência do 
sistema. Parâmetros do numerador da fun- 
ção de transferência, têm alguma influência 
na resposta do sistema, mas não alteram a 
posição dos polos. Por exemplo, uma função 
de transferência estável não perde estabili- 
dade por mais que se mudem parâmetros do 
seu numerador. 


No caso de um sistema em malha fechada, 
a situação é diferente. Os polos de malha fe- 


chada, que são as raízes da equação carac- 
terística, determinam o desempenho de um 
sistema de controle. A diferença importante 
que existe entre o caso de malha aberta e 
o de malha fechada é que parâmetros do nu- 
merador da função de transferência de malha 
afetam a equação característica de malha fe- 
chada, ou seja, afetam a localização dos polos 
do sistema controlado. Assim, é possível que 
um sistema estável em malha aberta se torne 
instável em malha fechada e vice-versa. 


Uma análise mais quantitativa do pro- 
blema envolve determinar como os polos de 
malha fechada variam à medida que um pará- 
metro qualquer do sistema de malha aberta 
é mudado. O método descrito na presente 
seção é um procedimento gráfico para deter- 
minar o lugar geométrico dos polos de malha 
fechada no plano complexo para valores de 
um parâmetro genérico 5 entre zero e infi- 
nito. O referido lugar geométrico é chamado 


lugar das raízes, pois os polos de malha fe- 
chada são as raízes da equação característica. 
A seguir são apresentadas as regras para seu 
traçado e na Seção 6.3 é mostrado como uti- 
lizar o lugar das raízes no projeto de sistemas 
de controle. 


5.5.1 Regras para traçar o lugar 
das raízes 


O ponto de partida é a equação característica 
do sistema em malha fechada, que podemos 
expressar da seguinte maneira 1+GH (2) = 
0, em que o subescrito 5 indica que a fun- 
ção de transferência de malha GH (z) de- 
pende desse parâmetro. O primeiro passo 
consiste em reescrever a equação caracterís- 
tica na forma 


Le pe =0, (5.64) 


em que a(z) e b(z) são polinômios na variável 


complexa z. Portanto, deseja-se saber como 
variam as raízes de (5.64) para 0 < 8 < 00. 
Em outras palavras, deseja-se conhecer o lu- 
gar geométrico da localização das raízes de 
(5.64) no plano complexo z para O < 5 < oo. 
Em primeiro lugar, é importante reescrever 
a equação característica na forma de (5.64), 
como ilustrado no próximo exemplo. 


[m] ta [m] 


Fi 


Exemplo 5.5.1 


Seja a quação característica 


à Lag Ear = 0 


que se deseja colocar na forma da Eq. 5.64. 
Para isso escreve-se: 


(2 +a2 +ag)+Bz = 0 
ú 
1+ =. lj 
Ê (23 + a222 + ao) 


que está na forma de (5.64). A segunda 
equação é obtida dividindo-se a primeira 
pela parcela entre parêntesis. O proce- 
dimento seguido neste exemplo pode ser 
aplicado em geral a equações caracterís- 
ticas em forma polinomial. 


Como a equação característica (5.64) é 
complexa, pois envolve a variável complexa z, 
essa igualdade pode ser desdobrada em duas, 
a saber: 


d(2) — ase (— — o | = 
fase (900) = fase(-1)=+180(2k+1),k=0,1,... 


|=1|=1. (5.65) 


Se o parâmetro 5 for um número real e 


positivo ele não altera a fase, e a primeira 
igualdade pode ser reescrita como 


= +180º(2k+1),k=0,1,.... (5.66) 


Se 5 <0, a fase é alterada de 180º, portanto 


b(z) 
“alo 


= 0º+360k,k=0,1,.... (5.67) 


A Eq. 5.66 é conhecida como a condição de 
fase, sendo que a Eg.5.65 é a condição de 
módulo. Assim, o lugar das raízes (de 180º 
ou positivo) é o lugar geométrico no plano z 
tal que a condição (5.66) é satisfeita. Se a 
equação característica for um polinômio na 
variável complexa de Laplace, s, a definição 
do lugar das raízes não muda e as regras para 
o traçado do lugar das raízes permanecem 
inalteradas. Analogamente, define-se o lugar 
das raízes negativo ou de 0º como o lugar ge- 
ométrico no plano z tal que a condição (5.67) 
é satisfeita. 


Um fato importante a seguir diz respeito 
ao número de polos e de zeros de uma função 
de transferência. A função em (4.1) tem n 
polos finitos, m zeros finitos e n — m zeros no 
infinito (ver Exercício 5.11). As regras para 
o traçado do lugar das raízes de 180º são: 


1. No plano z, marque com x as raízes de 
a(z) = 0, que serão chamados polos, e 
com o as raízes de b(z) = 0, que serão 
chamados zeros. 


2. O número de ramos do lugar das raízes 
é igual ao número de polos, sendo que 
cada ramo parte (para 8 = 0) de um 
polo e cada ramo chega (para 5 > 00) 
em um zero, seja finito ou no infinito. 
Além disso, o lugar das raízes é simé- 
trico em relação ao eixo real. 


3. Sobre o eixo real, o lugar das raízes 
encontra-se à esquerda de um número 


ímpar de polos e zeros (ver Exercí- 
cio 5.4). 


O lugar das raízes se estende para os 
n — m zeros que estão no infinito se- 
gundo n — m assíntotas, que formam 
os seguintes ângulos como o eixo real 


— 80(2k4+1) 
= n—m 


Vk 5k=0,1,...(5.68) 


Sen —m < 0, o número de assíntotas 
é In — ml e há ramos do lugar das raí- 
zes que chegam ao longo das assíntotas, 
pois nesse caso, que não ocorre em sis- 
temas causais de controle, há |n — m| 
polos no infinito. 


O ponto de encontro das assíntotas so- 
bre o eixo real é dado por 


Labe Do 
a=>—D— ++ 


n—m 


(5.69) 


em que p; são os polos (raízes de a(z) = 
0) e z; são os zeros (raízes de b(z) = 0). 


. Sem perda de generalidade, assume-se 
que o polo ou o zero em torno do qual 
o ângulo de partida ou de chegada se 
deseja calcular é p; ou 21, respectiva- 
mente. Assim, os ângulos de partida 
(de polos) e os de chegada (em zeros) 
são dados por: 


m,n 


qbp = >, 0-6; 180º-k360º, k =0,1,...q-1 
i,j=2 


m,n 
qe = 3) b;-0:+ 180º+k360º, k =0,1,...-1, 
i,j=2 


em que q é a multiplicidade do polo ou 
zero em questão, 0; é o ângulo da li- 
nha que une o i-ésimo zero ao polo (ou 
zero) cujo ângulo de partida (ou che- 
gada) está sendo calculado. De ma- 
neira análoga, 4; é o ângulo da linha 
do j-ésimo polo. 


7. Os pontos de partida sobre o eixo real 
são as raízes de 


a(o) HA = b(o) 42 =0. (5.70) 


Somente as raízes consistentes com o 
lugar das raízes sobre o eixo real devem 
ser consideradas. 


Exemplo 5.5.2 


Neste exemplo desejamos traçar o lugar 
das raízes para o sistema da Figura 5.28 
em função do ganho K a fim de conhecer 
a localização dos polos de malha fechada 
para valores de ganho na faixa O<K<oo. 


FIGURA 5.28: Sistema amostrado em 
malha fechada e T =1. 


O sistema em questão é o mesmo con- 
siderado no Exemplo 5.3.3 com a adição 
do referido ganho. A função de transfe- 
rência de malha é (ver Exemplo 5.3.3): 


e 0,4K (2 + 0,75) 
DO e ESA 


A equação característica para este 
exemplo é, portanto: 
0,4K (2 + 0,75) 


REGE O (5.71) 


que está na forma de (5.64). Assim, po- 
demos iniciar o traçado do lugar das raí- 
zes indicando os polos z = 1ez=04€e 
o zero em z = —0,75 (ver Figura 5.29). 
Como pode ser visto, o lugar das raízes 
sobre o eixo real encontra-se entre os po- 
los e à esquerda do zero, pois ao longo 
desses trechos a fase é um múltiplo ím- 
par de 180º. Do ponto de vista prático, o 
restante do lugar das raízes pode ser ob- 
tido notando que o ponto de partida so- 
bre o eixo real, onde os ramos dos polos 
se encontram, está aproximadamente no 
meio de caminho entre os polos, ou seja 
em z = 0,7, pois o zero está bastante 
afastado. O lugar das raízes prossegue 
em forma circular, com centro no zero. 
O gráfico da Figura 5.29 foi gerado 
usando o seguinte código Matlab: 


num=0.4+*[1 0.75]; Y polinômio do numerador 
% polinômio do denominador 

den=conv([1 -0.4], [1 -1]); 

% definição do sistema discreto (T = 1) 
sys=tf (num,den,1); 

% função que traça o lugar das raizes 
rlocus(sys) 

)% define os limites dos eixos 

axis([-2.5 1.2 -1.5 1.5]) 

% faz com que se tenha aparência circular 
axis equal 


0,5 f N 


(1 


-0,5+ 


“2,5 “2 -1,5 e -0,5 0 0,5 1 


FIGURA 5.29: Lugar das raízes da 
Ego om. 


Deve ser observado na Figura 5.29 
que para valores baixos do ganho K 
as duas raízes da equação característica 
(5.71), que são os polos de malha fe- 


chada, encontram-se dentro do círculo de 
raio unitário. Utilizando o critério de es- 
tabilidade de Jury (ver Sec. 5.2.2) é pos- 
sível determinar o valor de K a partir do 
qual o sistema em malha fechada torna- 
se instável (ver Exercícios 5.12 e 5.13). 


Exemplo 5.5.3 


No presente exemplo ilustramos como 
o método do lugar das raízes pode ser 
usado para investigar um problema em 
que o parâmetro de interesse não é o 
ganho. Em particular, desejamos saber 
como a escolha do tempo de amostragem 
T afeta a estabilidade do sistema amos- 
trado hipotético da Figura 5.30. Em uma 
aplicação real deveríamos incluir o ZOH 
depois do amostrador. 


FIGURA 5.30: Sistema amostrado de 
controle. 


A equação característica desse sistema 
é1+G(z), em que G(z) é a transformada 
Z da função de transferência de ramo di- 
reto. Fazendo isso temos: 


sans e) 
*R-DE-e) 


=0. (5.72) 


Como desejamos investigar o efeito de 
variar 7, é necessário colocar a equação 
característica na forma de (5.64) em que 
8 é T ou alguma função de T. Dessa 
forma poderemos investigar o que ocorre 
ao tomarmos o intervalo de amostragem 


na faixa O < T < oo. Contudo, obser- 
vando (5.72) percebemos que o intervalo 
de amostragem aparece como expoente 
de uma função. Se escolhemos 8 = e7 
encontramos à seguinte dificuldade: o lu- 
gar das raízes é traçado para 5 variando 
no intervalo O < 5 < oo o que corres- 
pondeaT >5ceT > —oo, respecti- 
vamente, em vez de O < T < oo, como 
desejado. A fim de contornar essa difi- 
culdade, escolhemos 8 = e” — 1 pois va- 
riando 7 de zero a infinito também cor- 
responde a O < 8 < oo. Portanto, mani- 
pulando (5.72), chegamos a: 


2? -z-eTz+eT+Kz-KeTz = 0 
ef; -eTz-z4+1+Kze" — Kz 0 
e"lz(z-1+K]-4(K+D+1 = 0 
(e Dlalz- 14021 FR) AK+ED)FI = 0 
(eT Dlz(z-1+K)]+(z a ="0 
; a(o IR) 
efe = 1) E 0, 
(5.73) 


que está na forma de (5.64) com 8=e” —1, 


como desejado. Portanto, basta traçar o 
lugar das raízes a partir de um polo du- 
plo em z = 1 e dois zeros reais: z = 0 e 
z=-K+1. O caso para K = 2,5 está 
mostrado na Figura 5.31. 


Im 


FIGURA 5.31: Lugar das raízes corres- 
pondente à equação característica 5.73 
para K = 2,5. 


Como pode ser visto, para valores do 
intervalo de amostragem até um certo va- 


lor crítico, a malha é estável. Usando o 
critério de módulo (5.65) para determi- 
nar esse valor crítico tem-se: 


WD 
B=[-1| = o E 
4 
Dos ad = 
e ns 


T = hn9=2,197. 


Note que o ponto crítico é aquele para 
o qual uma raiz da equação caracterís- 
tica de malha fechada deixa o círculo de 
raio unitário, portanto, trata-se do ponto 
z = —1. Devemos medir a distância de 
cada polo e cada zero a esse ponto. Como 
os polos estão ambos em z = 1, a dis- 
tância ao ponto crítico é 2. Isso explica 
o numerador de (5.74). Procedendo se- 
melhantemente com os zeros, vemos que 
um está a uma distância de 1 unidade 


e o outro a 0,5. Assim, para K = 2,5, 
o valor crítico para o intervalo de amos- 
tragem é T x 2197. Qualquer aumento 
nesse parâmetro a partir desse valor leva 
o sistema amostrado de controle da Fi- 
gura 5.30 à instabilidade. Esse resultado 
foi obtido de maneira mais simples no 
Exemplo 5.2.5 utilizando o critério de es- 
tabilidade de Jury. 


5.6 Complementos 


Complemento 5.1. 4 Regra de Mason 


Em um par de artigos publicados em 1953 
e 1956, Samuel Mason desenvolveu um pro- 
cedimento para resolver sistemas de equações 
(Mason, 1953; Mason, 1956). Esse procedi- 
mento é particularmente útil para determi- 


nar uma função de transferência de um sis- 
tema dado na forma de um diagrama de blo- 
cos ou um diagrama de fluxo de sinal, pois 
simplifica o processo de sucessivas substitui- 
ções de variáveis. O procedimento pode ser 
fornecido em forma fechada, que veio a ser 
conhecida como a fórmula de ganho de Ma- 
son 


1 p 
E > Na (5.75) 


em que G, é o ganho do n-ésimo caminho 
direto e p é o número de caminhos diretos, 


A=1-5 Pa + Pmo—> Posto, (5.76) 


sendo Pmr o produto dos ganhos de laço de 
todas as possíveis m combinações de r la- 
ços que não se tocam. A, é o valor de A 
para a parte do diagrama que não toca o n- 
ésimo caminho direto. Precisamos ainda das 
seguintes definições (Ogata, 1970): 


um nó é um ponto no diagrama, que 
representa uma variável ou um sinal; 


um ramo é uma conexão orientada en- 
tre dois nós. A orientação do ramo é 
indicada por uma seta; 


um nó de entrada ou fonte é um nó que 
possui apenas ramos que saem, e cor- 
responde a uma variável independente; 


um nó de saída ou sorvedouro é um nó 
em que somente há ramos que chegam 
a ele, e corresponde a uma variável de- 
pendente; 


um nó misto tem ramos que chegam e 
que saem; 


um caminho é um percurso de ramos 
ligados nos sentidos das setas. Se ne- 
nhum nó é cruzado mais de uma vez, 


o caminho é aberto. Um caminho fe- 
chado ou laço ocorre quando o cami- 
nho termina no mesmo nó do qual co- 
meçou e não cruza qualquer outro nó. 


7. o ganho de laço é o produto dos ganhos 
dos ramos que compõem o laço; 


8. laços que não se tocam não têm qual- 
quer nó em comum; 


9. um caminho direto conecta um nó de 
entrada (fonte) a um nó de saída (sor- 
vedouro) e que não cruza qualquer nó 
mais do que uma vez; 


10. o ganho de caminho direto é o produto 
dos ganhos dos ramos que compõem 
um caminho direto. 


Iustramos o uso da regra de Mason por 
meio de exemplos simples. 


Exemplo 5.6.1 


Considere o sistema de tempo discreto 
mostrado na Figura 5.32. Desejamos de- 
terminar a função de transferência entre 
u(k) e y(k) e no presente exemplo fare- 
mos isso aplicando a fórmula de Mason. 


FIGURA 5.32: Diagrama de simulação de 
sistema de tempo discreto. 


Portanto, para esse sistema temos: 


pois há dois caminhos diretos (p = 2) 
entre u(k) e y(k) na Figura 5.32 — um 
passa pelo bloco de atraso q ! e o outro 
passa pelo ramo superior do diagrama. 
O primeiro tem ganho G, = —q ! (note 
o sinal no ponto de soma mais à direita), 
e o segundo G, = 1. O único laço fe- 
chado no diagrama dessa figura — for- 
mado pelo ramo de realimentação — tem 
ganho P| = —q”!, portanto À = 1+g"1. 
O sinal negativo no ganho do laço é de- 
vido ao sinal negativo no ponto de soma 
mais à esquerda. A, é calculado com o 
A, mas removendo os laços que tocam 
o k-ésimo caminho direto. No presente 
exemplo, o único laço toca os dois ca- 
minhos diretos, portanto A, = A, = 1. 
Portanto, a função de transferência pode 


ser obtida como 


uk) 1 “a 
ui) O Trail O 
doa 1 e! 
OR Es 
2—1 
- (5.78) 


Exemplo 5.6.2 


Voltamos a considerar o sistema do Exem- 
plo 5.1.3. A fim de obter a função de 
transferência de malha fechada foi neces- 
sário resolver o seguinte sistema de equa- 


ções: 


As) = Gi(s)E“(s) — G5H' (s)A*(s) 
E“(s) = Rº(s)— Gi(s)A*(s) (5.79) 
Es Cio Er 


No presente exemplo, desejamos re- 
solver esse sistema de equações utilizando 
a fórmula de Mason. Para isso, começa- 
mos representado tais equações na forma 
de um diagrama de fluxo de sinal, conhe- 
cido como o diagrama de fluxo de sinal 
do sistema amostrado, indicado na Fi- 
gura 5.35. 


FIGURA 5.33: Diagrama de fluxo de si- 
nal do sistema amostrado (5.79). 


Observando a Figura 5.33 notamos que 
há somente um caminho direto que co- 
necta a entrada R*(s) à saída C*(s), por- 
tanto p = 1. Esse ramo direto tem ganho 
Gy = Gi(s)Gs(s). 

Há dois laços, que se tocam, pois 
compartilham o nó A*(s). Isso signi- 
fica que não há combinações de dois ou 
mais laços que não se tocam, logo só pre- 
cisamos calcular os ganhos P,, do pri- 
meiro somatório em (5.76). Assim temos 


2a — CHE (Ge 2 - CNI 
Portanto, 


A =1-(CGaH'(5)-Gi(s)G5(5)) 
=1+G>H (5) +GI(s)G5(5). 


Como os dois laços tocam o ramo direto, 
ao removê-los temos A, = 1. Por fim, 
usando esses valores na expressão (5.75) 
chega-se ao resultado em 


E Ci(s)G5(5) 
1+ Gi(5)G3(5) + 5H (5) 


que é o mesmo obtido anteriormente. 


Nota Histórica 


Em 1932, quando Nyquist propôs o critério 
de estabilidade que hoje leva seu nome, o 
método de Routh-Hurwitz já era conhecido, 
apesar de ainda não ser muito difundido. O 
critério de Edward Routh foi publicado em 
1877 como parte de uma monografia que ga- 
nhou o Prêmio Adams, da Universidade de 
Cambridge. O critério de Adolf Hurwitz, de- 
senvolvido de maneira independente, foi pu- 
blicado na forma de um artigo científico em 
1895. Em 1906 foi mostrado que as propos- 
tas de Routh e Hurwitz são equivalentes e, 
portanto, não é incomum referir-se a esse re- 
sultado como um único critério. 


O critério de Nyquist foi motivado pelo 
trabalho de Harold Black com amplificado- 
res realimentados. Black conseguia levantar 
experimentalmente a resposta em frequência 
de malha dos amplificadores, mas não sabia 


“predizer” quando, ao fechar a malha, o am- 
plificador seria estável. Esse desafio foi apre- 
sentado por ele a seu colega na Bell Labs, 
Harry Nyquist. Quando os artigos de Ny- 
quist, com o método, e o de Black, com a 
aplicação, foram publicados em 1932 e 1934, 
respectivamente, um argumento utilizado em 
favor do novo método em comparação ao de 
Routh-Hurwitz foi que o critério de Nyquist 
não requer um modelo matemático. 


Hoje, possivelmente, o argumento de Ny- 
quist e Black permaneceria inalterado, mas 
a terminologia utilizada seria um pouco di- 
ferente. O que seria dito é que o método de 
Nyquist requer um modelo não paramétrico, 
que é a resposta em frequência, ao passo que 
o critério de Routh-Hurwitz requer um mo- 
delo paramétrico, que é a equação caracterís- 
tica. A menos desse ajuste de terminologia, o 
argumento de Nyquist e Black estava correto 
em sua essência: é mais fácil, do ponto de 


vista prático, obter uma resposta em frequên- 
cia de malha para um dado sistema estável 
que obter a equação característica de malha 
fechada com qualidade equivalente. A esco- 
lha dos títulos das seções 5.2 e 5.3 reflete um 
viés histórico no desenvolvimento desses cri- 
térios de estabilidade. 


Witold Hurewicz (ver Nota Histórica do 
Capítulo 2), possivelmente foi o primeiro a 
mostrar o critério de estabilidade de Nyquist 
para o caso de sistemas de tempo discreto 
(Hurewicz, 1947, p. 256). Pouco mais de uma 
década depois, Jury apresentou o critério de 
Nyquist para sistemas discretos com deta- 
lhes (Jury, 1958, pp. 38-47). Hurewicz tam- 
bém escreveu as condições para que as raízes 
de um polinômio de segunda ordem tenham 
módulo menor que a unidade. Tais condi- 
ções eram precisamente as mesmas apresen- 
tadas por Jury alguns anos depois no con- 
texto de polinômios característicos de ordem 


qualquer. 

Bissel menciona que no início do século 20, 
surgiram dois trabalhos em que o critério de 
Hurwitz foi aplicado a sistemas discretos, após 
o uso de determinada transformação bilinear 
(Bissell, 1989). 

Jury elaborou diversos critérios de esta- 
bilidade. O critério de estabilidade descrito 
neste capítulo é conhecido como o critério ba- 
seado em tabela desenvolvido em 1961, e que 
foi publicado pela primeira vez no Capítulo 3 
de (Jury, 1964). 


Exercícios 


Com respeito ao script simrk ph CD pede-se: 


1. escolha uma função de transferência 
para representar o processo em ma- 
lha aberta. Essa função pode ser den- 
tre as que estão implementadas em 


simrk ph teste ou pode ser uma ob- 
tida por você. Chamando essa função 
de G(z), use o critério de Jury para 
achar a faixa de valores de K para 
a qual as raízes da equação caracte- 
rística 1+KG(z) = O tenha todas as 
raízes dentro do círculo de raio unitá- 
rio. Valide esse resultado por simulação 
usando simrk ph CD; 


- trace o diagrama polar de G(e!) 
usando a mesma função do item an- 
terior e aplique o critério de Nyquist. 
Faça isso para dois valores de K, um 
que garanta estabilidade e outro que 
não. Discuta os resultados à luz da- 
queles do item anterior; 


. é possível encontrar um valor de K tal 
que a margem de fase seja de 60º? Em 
caso positivo, que valor é esse? Feche 
a malha com esse valor de K e mostre 


a resposta ao degrau correspondente. 
Em caso negativo explique a razão e as 
possíveis consequências; 


4. trace a resposta em frequência do pro- 
cesso na carta de Nichols para os dois 
valores de ganho usados no segundo 
item. Determine as margens de ganho 
e de fase em cada caso; 


9. trace o lugar das raízes e discuta a coe- 
rência do resultado com os demais itens 
acima. 


5.1. Considere os sistemas mostrados na Fi- 
gura 5.34. 


FIGURA 5.34: Sistema em malha fechada do 
Exercício 5.1. 


Verifique se é possível obter a função de 
transferência em malha fechada para esses 
sistemas. Em caso afirmativo, forneça a fun- 
ção de transferência correspondente e, em caso 
negativo, explique a razão da impossibilidade. 


5.2. Resolva o Exemplo 5.1.3 usando a regra 


de Mason. 


5.3. Verifique se 
Q(z) = 2 — 1,872? — 1,052 — 0,20 = 0 


tem raízes fora do círculo de raio unitário uti- 
lizando o critério de estabilidade de Jury. 


5.4. Usando a condição de fase (5.66), expli- 
que a regra que determina que sobre o eixo 
real o lugar das raízes encontra-se à esquerda 
de um número ímpar de polos e zeros. 


5.5. Explique o formato do diagrama polar 
mostrado na Figura 5.17, especialmente para 
w>5>0tew> 0. 


5.6. Qual é o ganho CC da função de trans- 
ferência (5.33)? 


5.7. Explique porque se a função de mapea- 
mento F(s) for passa baixas o semicírculo de 
raio infinito no plano domínio será mapeado 
para a origem do plano imagem. 


5.8. Se na função de transferência mostrada 
em (5.43) o polo em z = 1 for mudado leve- 
mente paraz=1+e,0<e< 1, mostre que 
o diagrama polar passará a ter a aparência 
indicada na Figura 5.35. 
Im 
pior 


w > 07 vd 
w- 0t X—S6 w > ws /2 
FIGURA 5.35: Representação esquemática 


do diagrama polar da função de transferência 
usada no Exercício 5.8. 


Sabendo que a função de mapeamento tem 
um zero no infinito (ver Exemplo 5.3.6), apli- 
que o critério de fase de Cauchy para mostrar 


que essa função também tem um polo fora do 
círculo de raio unitário. 


5.9. Considere o sistema de controle mos- 
trado na Figura 5.36. A estabilidade desse 
sistema é influenciada por K e por T. Com 
respeito à estabilidade do sistema, pede-se: 


FIGURA 5.36: Sistema amostrado de con- 
trole do Exercício 5.9 


1. para um valor fixo de T > 0, use argu- 
mentos gráficos para mostrar que existe 
uma faixa de valores de ganho K tal 
que o sistema realimentado é estável; 


2. em sequência ao item acima, use argu- 
mentos gráficos para mostrar que existe 


um valor crítico de ganho K a partir 
do qual o sistema realimentado torna- 
se instável; 


3. determine analiticamente o valor crí- 
tico de ganho K mencionado no item 
anterior. 


5.10. Considere o sistema de controle em 
tempo discreto mostrado na Figura 5.37 em 
que T =1/9. 


FIGURA 5.37: Sistema de controle em tempo 
discreto com TV = 1/9. 


Projete um controlador D(z), o mais sim- 
ples possível, tal que sistema seja capaz de 
rastrear uma entrada em degrau com erro 
nulo em estado estacionário e que tenha um 
quociente de amortecimento mínimo de € = 
0,7. Nesse caso, qual é o menor erro possí- 
vel em estado estacionário para entrada em 
rampa unitária? 


5.11. Mostre que a função de transferência 
(4.1) tem n polos finitos, m zeros finitos e 
n — m zeros no infinito. Dica: tome o limite 
de z — oo e aplique o teorema de L'Hospital 
quantas vezes for necessário. Lembre-se que 
todo valor de z (mesmo infinito) que anula 
(4.1) é um zero. 


5.12. Utilizando o critério de estabilidade de 
Jury, determine o valor de ganho crítico para 
o sistema realimentado estudado no Exem- 
plo 5.5.2. Verifique esse resultado grafica- 
mente. Lembre-se que para o sistema desse 


exemplo, a condição de ganho é (note o for- 
mato da Eq. 5.33): 


I(z — Dz — 0,4)] 
lz+0,75| 


0,4K = 


5.13. No Exemplo 5.3.4 é visto que à medida 
que K aumenta, o sistema torna-se instável. 
O Exemplo 5.3.3 mostra que dois polos de 
malha fechada saem da circunferência de raio 
unitário — explique essa frase. Contudo, no 
Exemplo 5.5.2 é visto que um polo de malha 
fechada volta a entrar na circunferência de 
raio unitário. Explique isso à luz dos Exem- 
plos 5.3.3 e 5.3.4. 


5.14. Utilizando o critério de estabilidade de 
Jury, determine o valor de ganho crítico para 
as seguintes equações características: 


22-240,5+K0,152+K0,075 = 0 
22-22º4(1,5+K0,15)24K0,075-0,5 = 0. 


5.15. Considere o sistema em malha fechada 
mostrado na Figura 5.38. Obtenha a fun- 
ção de transferência de pulsos G(z) corres- 
pondente. Simule o sistema realimentado em 


tempo discreto 7 nos e simule a seguinte fun- 
EdOR 


ção de transferência em tempo contínuo Tre(s)? 
com G(s)=4/s + 2 para uma entrada em de- 
grau unitário. Compare os valores simulados. 
São equivalentes? Por quê? 

Aumente T gradativamente e, por simu- 
lação, determine um valor próximo ao valor 
crítico após o qual a malha do sistema amos- 
trado perde estabilidade. Procure confirmar 
os resultados de simulação pelo critério de 
Jury. 


FIGURA 5.38: Sistema amostrado de con- 
trole do Exercício 5.15. 


Capítulo 6 


Projeto no Domínio 
de Transformadas 


O objetivo deste capítulo é discutir conceitos 
relacionados a sistemas de controle e apresen- 
tar alguns métodos de projeto usando ferra- 
mentas no domínio de transformadas, o que 
inclui técnicas de projeto no domínio z, como 
o lugar das raízes e os métodos diretos, além 


de técnicas no domínio de frequência propri- 
amente dito. 


6.1 Desempenho de 
Sistemas 
Realimentados 


Possivelmente uma das questões mais fun- 
damentais no projeto de qualquer sistema é 
o fato de alguns dos objetivos almejados se- 
rem conflitantes. Essa realidade é particular- 
mente verdadeira no projeto de sistemas de 
controle. Antes de apresentar alguns méto- 
dos de projeto de controladores para sistemas 
amostrados, nesta seção desejamos discutir 
aspectos relacionados ao desempenho desses 
sistemas em que o conflito de objetivos é par- 
ticularmente verdadeiro. A discussão reali- 
zada nesta seção serve de “pano de fundo” no 
projeto de sistemas de controle, qualquer que 


seja o método escolhido. 


6.1.1 Estado estacionário versus 
regime transiente 


Em linhas gerais, a resposta forçada de um 
sistema dinâmico estável pode ser dividida 
em duas fases: o regime transiente e o estado 
estacionário. O regime transiente compre- 
ende o período de transição entre uma con- 
dição de operação estacionária e a seguinte, 
sendo que a mudança pode ter sido provo- 
cada por uma alteração na entrada do sis- 
tema ou pela ação de um distúrbio. O es- 
tado estacionário, por sua vez, é a condição 
de operação permanente, da qual o sistema 
não sairá, a menos que alguma outra ação 
seja efetuada sobre ele. Por essa razão, o es- 
tado estacionário é também chamado de re- 
gime permanente. É importante notar que o 
estado estacionário não implica que a saída 


do sistema seja constante, mas significa que 
o padrão de comportamento não se altera, 
até que uma nova mudança seja necessária 
ou provocada. 


Por exemplo, o estado estacionário ideal 
da tensão v(t) do sistema de distribuição de 
energia elétrica em funcionamento normal é 
um comportamento senoidal, com amplitude 
e frequência constantes. Em alguns casos, 
ao se ligar uma carga como um chuveiro ou 
quando o compressor da geladeira é acionado, 
é possível perceber uma flutuação na ilumi- 
nação, sendo que em questão de pouco tempo 
o sistema se acomoda em uma nova condição 
de operação e não mais é possível observar 
variações na iluminação. O breve período 
durante o qual é possível notar os efeitos de 
flutuações no nível de tensão é o regime tran- 
siente, após o qual o sistema, por ser estável, 
atinge a nova condição de operação: o estado 
estacionário. 


Na análise a seguir fazemos referência ao 
sistema mostrado na Figura 6.1, em que além 
da entrada de referência R(s) também é in- 
dicado o sinal de distúrbio W(s), que tam- 
bém é uma entrada para a malha fechada, 
pois W(s) afeta C(s). Comecemos desconsi- 
derando o distúrbio, W(s) = 0. 


R(s)— 


E*(s) (s) 

Fo EE 
(po G(s) [> c(s) 
FigurA 6.1: Sistema em malha fechada, 
sendo W(s) o sinal de distúrbio. O amos- 
trador após o bloco D(z) não existe fisica- 
mente, mas faz parte da representação do 
conversor D/A (ver Figura 6.5). O sinal após 
esse amostrador é E*(s)D*(s) e também não 


existe fisicamente, mas permite descrever o 
sistema como discutido no texto. 


Wís 
( 


Para o sistema da Figura 6.1 podemos es- 
crever (W(s) = 0): 


E“(s) = R*(s) — E(S)D*(S)GH (s) 


CO R() 
1+ D(s)GH” (8) 

Eu = ais 
1+ D()CH()' 


em que E(z) é chamado de erro de aciona- 
mento, para distingui-lo do erro que é, por 
definição, R(s) — C(s). Se H(s) = 1, o erro 
de acionamento é igual ao erro. Assumindo 
que H(s) = 1 e que a entrada é um degrau 
unitário, tem-se 

1 z 


E de p= PU 


A expressão (6.1) corresponde ao erro co- 
metido pelo sistema de controle da Figura 6.1 
com H(s) = 1 para uma entrada em degrau 
unitário. Como o sistema é dinâmico, sa- 
bemos que não responde instantaneamente a 
mudanças de referência. Mas o que ocorre em 
estado estacionário? À medida que o sistema 
se acomodar na nova condição de operação, 
será que o erro irá para zero? Essa situação 
pode ser analisada com o auxílio do teorema 
do valor final para os casos em que o erro 
não diverge (ver Propriedade 3.1.7). Nesse 
caso pode-se escrever: 


e(00) = lim(z — 1) E(z) 


“e DrDwcmE- 
1 1 
(6.2) 


“CEEDANGO). LA 


em que a constante de erro de posição é de- 


finida como 


para sistemas do tipo 0, pois para sistemas de 
tipo superior a constante de erro de posição 
é infinita. O resultado em (6.2) mostra que 
para sistemas em que K, é finito (sistemas do 
tipo 0), o erro de posição, ou seja, o erro em 
estado estacionário para entradas em degrau, 
é tanto menor quanto maior for K,. 

É possível fazer uma análise análoga para 
entradas em rampa. Nesse caso, o erro é dado 
por 


1 Tz 


PO EEDOGCO GIP 


(6.4) 


e aplicando o teorema do valor final chega-se 


Ps 
o ECO (EI 
= lim e 
“A +D(SG(O (2-1) 
= lim Ra 
2 (2-1) + D(2)G(2)(2—1) 
e Tr 1 
= lim = (6.5) 


1 D(2)G(2)(2—1) Ky 


de onde se tem a definição da constante de 
erro de velocidade: 


Kia D(2)G(z)(2z—1) 
251 FT 

que é zero para D(z)G(z) do tipo 0, finita 
para sistemas do tipo 1 e infinita para siste- 
mas do tipo 2 e superior. A expressão (6.5) 
indica que para sinais de referência em rampa, 
o erro em estado estacionário, também cha- 
mado de erro de velocidade, é inversamente 
proporcional a K,. 


(6.6) 


Um ponto de fundamental importância 
no desenvolvimento realizado até aqui é que 
tanto no caso do erro de posição, quanto 
no de velocidade, tais erros são tão menores 
quanto maiores forem as respectivas constan- 
tes. Pelas definições dessas constantes (ver 
Eq. 6.3 e Eq. 6.6) é possível ver que tais gran- 
dezas são definidas para frequências que ten- 
dem a zero (ver Exemplo 5.3.5). Em outras 
palavras, a fim de reduzir o erro de posição 
é necessário aumentar o ganho CC de ramo 
direto, uma vez que H(z) = 1. Além disso, 
para reduzir o erro de velocidade é necessário 
que a função de transferência de ramo direto 
tenha um poloem z=1equeo K, seja alto. 
Em síntese: a redução de erro em estado es- 
tacionário requer elevados ganhos em baixas 
frequências. 


Qual é a consequência, em termos de de- 
sempenho, do aumento de ganho ou da inclu- 
são de um polo em z = 1? Diversos resulta- 


dos obtidos no Capítulo 5 permitem concluir 
que, de maneira geral, o aumento do ganho 
em baixas frequências deteriora o desempe- 
nho transitório, sendo que a malha pode até 
tornar-se instável. Alguns desses aspectos 
são ilustrados no próximo exemplo. 


Exemplo 6.1.1 


Seja a função de transferência de malha 
de um sistema de controle com realimen- 
tação unitária, ou seja, H(z) = 1 


E pais vs) 


G 
(2) 2 —-2+0,5' 


que é do tipo zero com polos em 2=0,5 + 
70,5. Sabemos pelos resultados desta se- 
ção que o sistema em malha fechada cor- 
respondente, C(2)/R(2)=G(2)/[1+G(2)], 


apresenta erro não nulo para entradas em 


degrau. De fato, usando (6.2) o erro em 
estado estacionário pode ser determinado 
como 1/(1 + K,) sendo que 


K, = G(1) = 0,45, (6.7) 


logo e(00) = 0,7. Isso corresponde a 
ter uma saída em estado estacionário em 
torno de c(o0) = 0,3 para um degrau 
unitário como referência. A fim de eli- 
minar o erro em estado estacionário para 
entradas em degrau pode-se acrescentar 
um polo em z = 1. Assim, a função de 
transferência de malha torna-se: 


0,15(2 + 0,5) 
(:=1)(2-2+05)] 


Gi(z) =— 


A Figura 6.2 mostra os respectivos di- 
agramas polares de G(e!“) e Gi(e!º). A 
margem de fase de G(e'”), por se tra- 
tar de um sistema de segunda ordem, é 


infinita (por quê?) e sua margem de ga- 
nho é relativamente grande. Ao contrá- 
rio, as margens de fase e de ganho de 
Gi(e!º) são bem pequenas. Essa redução 
foi consequência da inclusão do polo em 
z = 1. Contudo, pelos gráficos polares 
e sabendo-se que ambos os sistemas são 
estáveis em malha aberta, o critério de 
Nyquist indica que as respectivas malhas 
fechadas são estáveis. 

A Figura 6.3 mostra as respostas ao 
degrau unitário das respectivas malhas 
fechadas. Os seguintes aspectos eram es- 
perados em função das discussões ante- 
riores. À resposta do sistema com fun- 
ção de transferência de malha Gi(z) é 
bem mais oscilatória, graças às pequenas 
margens de ganho e de fase, como visto 
na Figura 6.2. Se o tempo de simula- 
ção for aumentado o suficiente, é possível 
constatar que a resposta do sistema com 


Gi(z) estabiliza em c(00) = 1, ou seja, 
como esperado, o erro em estado estaci- 
onário para entradas em degrau é nulo. 
Por outro lado, note pela Figura 6.3 que 
c(o0) = 0,3 para o sistema com G(z), 
como antevisto. 
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FigurA 6.2: Diagramas polares de 
(—) G(e') e (--) Gi(e”) do Exem- 
plo 6.1.1. 


0 10 20 30 40 50 


FigurA 6.3: Respostas ao degrau de 
ES DES e de (-*-) E do Exem- 
plo 6.1.1. Os valores nos tanto de 
amostragem estão indicados por círculos 
e asteriscos, que foram ligados por linhas 


contínuas somente para guiar o olho. 


Este exemplo mostra que o efeito da 
inclusão de “integração” na malha, ou seja, 


aumentar o tipo da função de transferên- 
cia de malha, melhora a acurácia em es- 
tado estacionário em detrimento da res- 
posta transiente. Portanto, em projeto 
de sistemas de controle a inclusão de po- 
los em z = 1 deve ser compensada de 
maneira a garantir uma resposta transi- 
ente adequada. 


Concluímos, então, que melhorar o de- 
sempenho de um sistema de controle em es- 
tado estacionário e em regime transiente são 
objetivos conflitantes. Isso significa que o 
projetista deve tomar decisões de compro- 
misso. 


Exemplo 6.1.2 


Voltamos a considerar os sistemas de ma- 
lha aberta investigados no Exemplo 6.1.1. 
Em vez de realizar a análise usando di- 


agramas polares, o faremos por meio do 
lugar das raízes e do critério de estabi- 
lidade de Jury. O lugar das raízes para 
os sistemas em questão estão mostrados 
na Figura 6.4. Nesses casos interpreta-se 
que a função de transferência de malha 
aberta é KG(z) e KGi(z), sendo que o 
ganho é variado na faixa O < K < oo. 

No gráfico da Figura 6.4b, é possível 
ver que um dos ramos do lugar das raí- 
zes inicia em z = 1, que é um dos po- 
los de Gi(z), portanto, o tipo do sistema 
em malha aberta e, consequentemente, o 
comportamento do erro em estado esta- 
cionário pode ser obtido do lugar das raí- 
Zes. 

Em ambos os casos é possível ver 
que as correspondentes malhas fechadas 
tornam-se instáveis à medida que o ga- 
nho K aumenta. Isso era esperado da 
Figura 6.2 onde é possível ver que as mar- 


gens de ganho tanto de um sistema como 
do outro são finitas. Usemos agora o cri- 
tério de estabilidade de Jury para deter- 
minar o ganho crítico em cada caso. 
Começamos determinando a equação 
característica de cada sistema, ou seja 


1+KG(z)=0 
2 -2+0,5+K0,1524+K0,075 = 0 (6.8) 


1+KGi(z) = 0 
2º-92224(1,54+K0,15)2+K0,075-0,5 = O. (6.9) 


Usando o critério de Jury, o valor crítico 
para (6.8) é K = 6,6667 e para (6.9) é 
K = 1,0819 (ver Exercício 5.14). Esses 
valores indicam que ao passo que o ga- 
nho de malha pode ser aumentado mais 
de seis vezes antes de atingir a instabili- 


dade no primeiro caso, no segundo, prati- 
camente não é possível aumentar o ganho 
de malha. Assim, as principais conclu- 
sões a que chegamos usando o diagrama 
polar também podem ser vistas no con- 
texto do lugar das raízes. 
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FIGURA 6.4: Lugar das raízes para funções 
de transferência de malha aberta (a) G(z) e 
(b) Gi(z) do Exemplo 6.1.1. 


6.1.2 Regulação versus 
rastreamento 


A função de transferência em tempo dis- 
creto em malha fechada, da referência para 
a saída do sistema mostrado na Figura 6.1 
para H(s) = 1 é 


O(2)  D(G() 
R(z) 1+ D(2)G(z) 
No(2)Ne(z) 


> Dotibed simao CO 


em que Np(z) e Ne(z) são os polinômios do 
numerador de D(z) e G(z), respectivamente, 
e Dp(z) e De(z) são os polinômios do deno- 


minador. 
ÃO O 
Rm E 
[m] [opere 


No problema de rastreamento, também 
conhecido como o problema de servomeca- 


nismo ou problema de seguimento, deseja- 
se que a saída c(k) siga a referência r(k) 
tão próximo quanto possível. Em termos da 
função de transferência em malha fechada, 
o ideal (não realizável) é que a malha fe- 
chada se comportasse como um sistema in- 
finitamente rápido com ganho unitário, ou 
seja, C(z)/R(z) = 1. Isso só pode ser alcan- 
çado de forma aproximada se 1 < |D(z)G(z)|. 
Pelo critério de estabilidade de Nyquist (ver 
Seção 5.3), sabemos que se o ganho de ma- 
lha for muito maior que um é provável que o 
sistema em malha fechada seja instável. Por 
outro lado, segundo os resultados da subse- 
ção anterior, o ganho só precisa ser elevado 
em baixas frequências para se ter bom de- 
sempenho em estado estacionário. Portanto, 
uma solução de compromisso é escolher D(z) 
de tal maneira que 


Cleis) — D(cis)G(eis) 
R(eiv) 1+D(eiv)G(eiv) 


= 1 (6.11) 


para a faixa de frequências w mais ampla pos- 
sível. Quanto mais ampla for essa faixa, me- 
lhor é o rastreamento de sinais com frequên- 
cia na referida faixa de frequência, mas me- 
nor é a margem de estabilidade. Existem 
várias maneiras de realizar esse projeto, al- 
gumas das quais são apresentadas neste ca- 
pítulo. 


As raízes de Dp(2)De(2)+Np(2) Ne(z) = 
O são os polos de malha fechada. Se alguns 
desses polos forem lentos, o sistema em ma- 
lha fechada é ineficaz em problemas de ras- 
treamento. Uma solução para essa situação 
é colocar zeros de malha fechada, que são 
as raízes de Np(z)Ne(z) = 0, próximos aos 
polos lentos de malha fechada. (Como nor- 
malmente não se mexe em G(z), que inclui 
o ZOH e a planta, basta colocar os zeros do 
controlador D(z) próximos aos polos lentos 
de malha fechada. Isso é feito no Exem- 
plo 6.4.1. 


Consideremos agora o problema de regu- 
lação, ou de rejeição de distúrbios. Nesse 
caso supõe-se R(s) constante. O distúrbio 
W/(s) afeta a malha e deseja-se que o contro- 
lador D(z) retorne a saída C(s) ao valor que 
tinha antes da mudança de W(s) da forma 
mais rápida possível. Sem perda de gene- 
ralidade, podemos considerar o caso em que 
R(s) = 0. Portanto, no problema de regula- 
ção a função de transferência de interesse é 
entre o distúrbio e a saída, ou seja, 


C(z) G(z) 
W(z) 1+ D(2)G(z) 
E Dp( Note) 
DolDel)+No(dNato) (613 


Como o objetivo no caso de regulação 
é ter ganho nulo, em estado estacionário, 
deseja-se escolher D(z) de tal maneira que 


Ceia 
W(eiv) 1+D(eir)G(eiv) 
1 
Ge eo RS) (6.13) 


D(eiv) 


para frequências em que 1 < |D(e'“)G(e')|. 
As diferenças com respeito ao caso de ras- 
treamento são perceptíveis. Por exemplo, se 
1< |G(e'º)|, que é o caso se a planta tiver 
integração, então 1 < |D(e'?)G(e'“)| pode 
ser alcançado — condição para se ter bom de- 
sempenho no rastreamento — mesmo para va- 
lores de ganho de D(e'”) relativamente bai- 
xos e, nesse caso, 1/|D(e!“)| não é apro- 
ximadamente zero. Essa dificuldade não é 
sentida no caso de rastreamento, pois para 
as frequências em que 1 < |D()G(e!v)|, 
a resposta em frequência da malha fechada 
aproxima-se da ideal. Esse é o cenário des- 
crito no Exemplo 6.4.1. 


Outra maneira de ver as diferenças en- 
tre o caso de rastreamento e o de regula- 
ção é considerar a função de transferência de 
malha fechada (6.12). Os polos em malha 
fechada tanto para o caso de rastreamento 
quanto para o de regulação são os mesmos, 


ou seja, as raízes da equação Dp(2)De(z) + 
Np(2)Ne(z) = 0. No caso de rastreamento, 
como foi visto, é possível reduzir drastica- 
mente o efeito de polos lentos posicionando 
os zeros de D(z) próximo a eles. No caso do 
problema de regulação, como visto em (6.12), 
os zeros de D(z) não são zeros de malha fe- 
chada e, portanto, sua alocação não pode ser 
utilizada para cancelar polos (lentos) de ma- 
lha fechada na resposta ao distúrbio. Ou, 
dito de outra forma, usando os zeros de D(z) 
para tornar o sistema em malha fechada mais 
rápido em problemas de seguimento de tra- 
jetória é ineficaz para tornar o sistema mais 
rápido na rejeição de distúrbios. 


Esta breve discussão mostra que os pro- 
blemas de rastreamento e de regulação dife- 
rem em aspectos essenciais e que, em alguns 
casos, um bom servomecanismo não necessa- 
riamente é um bom regulador, e vice-versa. 


Exemplo 6.1.3 


Considere o sistema mostrado na Fi- 
gura 0.5, com FP = 1. 


FIGURA 6.5: Diagrama de blocos do sis- 
tema em malha fechada. Aqui é indicado 
explicitamente (em pontilhado) o modelo 
para o conversor D/A, que consiste de 
um amostrador ideal, que não existe fi- 
sicamente, e de um segurador de ordem 
zero. À função de transferência de pulsos 
está indicada em tracejado. 


As especificações para o sistema de 
controle são: sobressinal máximo de 
16%, tempo de acomodação menor que 
10 segundos e K, > 0,5 no problema de 
seguimento de trajetória, ou seja, o pro- 


blema de servomecanismo. . 5 
Comecemos por determinar a função 


de transferência de pulsos 


E les = Es ( 0,1 ! 
E s s(s+0,1) & s2(s +0,1) 


— ale Ones beso ones 0] 
z 0,1(z — 1)2(z — e—0,1) 
0,0484(z + 0,9667) 


* (E - D( -— 0,9048)' (ota) 


em que o segundo passo foi realizado 
consultando-se a tabela de transfor- 
mada Z. 

O objetivo neste exemplo é atender- 
mos à condição (6.11). Com essa expres- 
são refere-se à malha fechada, usamos a 
carta de Nichols. Assim, iniciamos tra- 
çando a resposta em malha aberta do sis- 
tema não compensado G(ee7), T =1 
nos eixos da carta de Nichols, como mos- 
trado na Figura 6.6. 
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FigurA 6.6: Diagrama de Nichols. 
() Gl, T=1. O efeito do regu- 
lador deve ser o de deslocar G(e'“7) 
para a direita formando uma “barriga” 
de modo a coincidir com o círculo M de 
0dB tanto quanto possível. A resposta 
em frequência do sistema compensado é 
(+) D(eieD)G(ei“7), com D(z) dado em 
(GS nes 5 6: 


Como o objetivo é que a malha fe- 
chada atenda (6.11) para uma faixa de 
frequências tão ampla quanto possível, 
desejamos mover à resposta em frequên- 
cia de malha aberta para o mais próximo 
possível do “círculo M de 0dB” (ver Se- 
ção 5.4). Grosso modo, isso significa pu- 
xar a curva de resposta em frequência 
para a direita, mas formando uma “bar- 
riga”. Por exemplo, o ganho do sistema 
não compensado a uma frequência wo (na 
base da seta mostrada na Figura 6.6) é 
10 dB e a fase é aproximadamente — 155º. 

O sistema compensado, deve ter uma 
fase em torno de — 100º (a cabeça da seta 
mostrada na Figura 6.6) no ganho 10 dB. 
Portanto, vemos que o efeito do compen- 
sador deve ser o de adicionar fase, espe- 
cialmente em frequências intermediárias. 
Como visto na Seção 6.2 essa classe de 
reguladores chama-se compensadores de 


avanço de fase. 

Para esse ffm escolhemos o zero e o 
polo do compensador um pouco abaixo e 
um pouco acima da frequência onde ha- 
verá o maior deslocamento de fase (con- 
fira a Figura 6.10 ). A distância entre o 
zero e o polo é da ordem de uma década. 
Essa frequência corresponde aproxima- 
damente à base da seta e é 0,166rad/'s. 
Lembre-se que a frequência “corre ao 
longo da curva”. Para fins deste exem- 
plo, usamos w, = 0,1 e wp = 2,5 como 
tais frequências. A fim de mapearmos 
essas frequências para posições do zero e 
do polo usaremos o gabarito do Matlab, 
mostrado na Figura 6.7. O que interessa 
aqui são as curvas do ábaco que têm iní- 
cio e fim sobre a circunferência — não as 
que tem início e fim em z = 1 — e que es- 
tão indicadas na forma Si Us Elas 
mostram o lugar geométrico no plano z 


correspondente à frequência em questão. 
Como o zero e o polo do regulador em 
questão são reais, o que interessa de ime- 
diato é o lugar aproximado em que tais 
curvas cruzam o eixo real. Assim, para o 
zero, a = wy/7 = 0,03. Como não temos 
no ábaco a curva correspondente a esse 
valor de a — a menor curva corresponde 
aa=b0,1-o ponto de cruzamento pode 
ser obtido por meios gráficos ou por uma 
regra de três simples. Assim chegamos a 
z 2 0,91 para o zero. No caso do polo 
a =wp/ms 0,8. Nesse caso temos uma 
curva, que cruza o eixo real em z = 0,08. 

Até aqui chegamos à seguinte estru- 
tura para o controlador: 


a AS 


D(z2)=-HKp- 
(z) E 


(6.15) 


do qual o valor de Kp ainda precisa ser 


determinado. 

Traçando a resposta em frequência de 
D(e)G(e!“), ou seja, do sistema com- 
pensado com Kp = 1 na carta de Ni- 
chols é imediato ver que o ganho deve au- 
mentar de aproximadamente 15 dB para 
se aproximar do círculo M de 0dB, logo 
Kp = 5,6 (ver Exercício 6.1). 

As respostas ao degrau dos sistemas 
em malha fechada, sem compensador, e 
com o compensador (6.15) estão mostra- 
das na Figura 6.8. À resposta ao degrau 
do sistema compensado tem um “perfil” 
mais próximo ao degrau unitário proque 
atende melhor à condição (6.11) do que 
o sistema não compensado. 
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FIGURA 6.7: Gabarito do plano z feito 
pelo Matlab com o comando zgrid se- 
guido de axis(ºequal”?). 


FIGURA 6.8: Respostas ao degrau unitá- 
rio da malha fechada: (— o —) sem com- 
pensação, e (— + —) compensado com 
D(z) em (6.15). 


No Exemplo 6.4.1 descreve-se o projeto 
de um regulador para o mesmo sistema 
usando o lugar das raízes. Além disso, nesse 
exemplo é visto que um regulador que atende 
às especificações para o problema de servo- 


mecanismo (seguimento de trajetória) pode 
não ter desempenho satisfatório em proble- 
mas de regulação. 


6.1.3 Velocidade de resposta 
versus rejeição de ruído 


Na prévia discussão sobre o problema de 
servomecanismo, para que o sistema em 
malha fechada seja capaz de rastrear si- 
nais de referência “rápidos” é necessário que 
IC(e)/R(e!º)| seja plana para uma faixa 
de frequências tão ampla quanto possível. 
Dito de outra maneira, as componentes de 
frequência do sinal de referência R(e'”) de- 
vem estar contidas na banda passante do sis- 
tema de malha fechada. 

Como o sinal de referência pode ter com- 
ponentes de alta frequência, por exemplo se 
r(t) for um degrau, sob o aspecto de capaci- 
dade de rastreamento, é normalmente dese- 


jável que a função de transferência de malha 
e, consequentemente, a função de transferên- 
cia de malha fechada tenha ampla banda de 
passagem. Essa situação, contudo, é ruim do 
ponto de vista de rejeição de ruído de alta 
frequência. Ruído de alta frequência pode 
entrar em vários pontos da malha como, por 
exemplo, no ramo de realimentação — ruído 
de medição —, ou no ramo direto — ruído de 
atuador e distúrbios de alta frequência. Para 
atenuar o ruído é desejável que a banda pas- 
sante seja a mais estreita possível. Portanto, 
aumentar a velocidade de resposta e reduzir 
o efeito de ruído na malha são objetivos con- 
flitantes. 


Exemplo 6.1.4 


A Figura 6.9 mostra a resposta em ma- 
lha fechada dos sistemas considerados no 
Exemplo 6.1.8. 


Na simulação, a referência ficou inal- 
terada em zero. Foi adicionado ruído ao 
sinal realimentado, representando ruído 
de medição. Note como a saída do sis- 
tema compensado é mais contaminada 
por ruído de alta frequência do que a 
malha sem o compensador. Isso era es- 
perado, pois o sistema compensado tem 
uma banda de passagem mais ampla, per- 
mitindo assim o aparecimento de compo- 
nentes de alta frequência na saída. Deve 
ser notado que o sistema não compen- 
sado também é suscetível ao ruído, só que 
isso ocorre em frequências mais baixas. 


c(k) 


FigurA 6.9: Respostas com ruído de 
medição do (—) sistema não compen- 
sado, e (——) sistema compensado com 
D(z) em (6.15) para referência nula. 


6.2 Controladores 
Clássicos 


Nesta seção descrevemos brevemente algu- 
mas classes de controladores clássicos. A ên- 
fase é na “topologia” dos controladores. Ao 
longo do capítulo descrevemos conceitos e 
ideias que podem ser utilizados para o pro- 
jeto, ou sintonia, desses controladores. 


6.2.1 Compensadores de avanço 
e atraso 


Um tipo bastante simples de compensador é 
representado por 


Z— 20 


D(z) = K (6.16) 


2— 2. 
em que 29 é o zero, 2, é o polo e K é uma 
constante. O ganho de D(z) em frequência 
zero é D(1) = K(l-20)/(1-2p). Se 20 estiver 
a uma frequência mais baixa que zp D(z) é 
chamado de um compensador de avanço de 
fase. Por outro lado, se 2) estiver a uma 
frequência mais alta que zp D(z) é chamado 
de um compensador de atraso de fase. 

No projeto de compensadores de avanço 
de fase, o que normalmente se faz é escolher 
2% e 2p de modo que a frequência de cruza- 
mento fique entre ambos com o objetivo de: 
i) aumentar a frequência de cruzamento e, 
portanto, a banda passante do sistema em 


malha fechada, ii) elevar a fase em torno da 
frequência de cruzamento, para aumentar a 
margem de fase. O máximo aumento na fase 
conseguido para a frequência intermediária 
entre 29 € zp e corresponde a 


l-a 
l+a 


max (ZD(2)) = sen”! ( ) » (6.17) 


sendo a = 29/2p. Portanto, a Eq. 6.17 pode 
ser utilizada para determinar a razão entre 
as frequências do zero e do polo. Deve ser 
lembrado que, na prática, o máximo avanço 
de fase que pode ser alcançado de forma viá- 
vel com um regulador de avanço de fase de 
primeira ordem é de aproximadamente 60º. 
No caso de projeto de compensadores de 
atraso de fase, a filosofia é diferente. O obje- 
tivo é não alterar a fase em torno da frequên- 
cia de cruzamento e sim reduzir tal frequên- 
cia de maneira a se ter uma margem de fase 
melhor. A redução da frequência de cruza- 


mento normalmente pode ser alcançada re- 
duzindo o ganho em torno dessa frequência. 
Mas para manter o ganho em baixas frequên- 
cias elevado, garantindo assim bom desempe- 
nho em estado estacionário, coloca-se o zero 
bem abaixo (aproximadamente uma década, 
da frequência de cruzamento. O polo, cuja 
frequência é ainda menor, pode ser escolhido 
de forma que D(1) = K(1 — zo)/(1 — 25) 
atenda os requisitos de desempenho em es- 
tado estacionário. 


As frequências em que ocorrem o zero e o 
polo são baixas e podem ser próximas. Nesse 
caso, se o número de bits utilizado para im- 
plementar D(z) não for suficientemente alto, 
o erro de quantização pode tornar-se signifi- 
cativo (Phillips e Troy Nagle, 1995). 


É possível combinar esses dois compen- 
sadores para produzir o compensador em 
avanço-atraso, que é uma generalização do 
conhecido controlador PID (proporcional- 


integral-derivativo). 


Exemplo 6.2.1 


Considere o regulador de avanço de fase 
dado por 

10(z — 0,99048) 
D = 

(2) z-—0,9048 * 


(6.18) 


que tem ganho em frequência baixa 
D(1) = 1 e em altas frequências, 
D(—-1) = 10,45. A frequência do zero 
é wo = |(1n0,99048)|/7 = 0,0957rad/s 
e a do polo é w, = |(In0,9048)|/T = 
1,0004rad/s, ou seja, o polo está apro- 
ximadamente uma década de frequência 
acima do zero. À resposta em frequência 
do regulador em avanço (6.18) está mos- 
trada na Figura 6.10 e os comandos do 
Matlab usados são: 


num=[10.0000 -9.9048] ; 
den=[1.0000 -0.9048] ; 

T=0.1; % período de amostragem 
h gera o diagrama de Bode 
dbode (num, den,T); 


Seja o regulador de atraso de fase 


D(e) 0,5(z — 0,9920) 
E) = 
2 — 0,9990 


(6.19) 


(0) Es 1 1 1 
10º 10º 10" 10º 10 10 
Freq. (rad/s) 


FigurA 6.10: Resposta em frequência 
para compensador em avanço (6.18). 
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FiGURA 6.11: Resposta em frequência 
para compensador em atraso (6.19). 


Para (6.19) tem-se D(1) = 4e 
D(—1) = 0,4982. A frequência do zero 
está em torno de wo = |(1n0,992)|/T 
0,0803rad/s e a do polo é w, = 


Q 


(In 0,999)//7 = 0,0100rad/s. A res- 
posta em frequência do regulador em 
atraso (6.19) está mostrada na Fi- 
gura 6.11. 


6.2.2 O Controlador PID 


O controlador PID (proporcional, integral e 
derivativo) é um dos controladores mais uti- 
lizados na indústria de processos. A ideia 
principal por trás desse controlador, é que 
a ação de controle é composta de uma par- 
cela proporcional ao erro, outra proporcional 
à integral do erro e, por fim, outra que é pro- 
porcional à derivada do erro. Chamemos de 
m(k) a ação de controle e de e(k) o erro. Note 
que e(k) é a entrada do controlador e m(k), 
a saída. A parcela proporcional ao erro pode 
ser escrita como 


mplh) = Kelk), (6.20) 


em que a constante K é conhecida como o ga- 
nho proporcional. No domínio z (6.20) pode 
ser escrita como 


My(2) = KE(?). (6.21) 


A parcela proporcional à “integral” do erro 
pode ser aproximadamente escrita como 


mui(k) = mi(k — 1) + ae(k), (6.22) 


em que está evidente o efeito de acumular 
o erro e(k) em mi(k), com ponderação a. É 
conveniente escolher a = mi, em que T; é co- 
nhecido como o tempo integral e T é o tempo 
de amostragem. No domínio z (6.22) pode 
ser escrita como 


K Tz 
Mi A 


E(Z). (6.23) 


Por fim, a parcela proporcional à “derivada” 
do erro pode ser escrita como 


ma(k) = Ble(k) —e(k— 1], (6.24) 


em que se vê que ma(k) é proporcional à 
primeira diferença do erro com constante de 
proporcionalidade 5. Escolhendo 5 = Fãs, 
em que a constante Ty é conhecida como o 
tempo derivativo, (6.24) pode ser represen- 


tado no domínio z como 


dd ao] 
E z 


Ma(z) E(z). 


A saída de um controlador PID é, por- 
tanto, a soma das três parcelas, ou seja, 


M(2) = Mylz) + Milz) + Ma(2), 


que, depois de substituições, resulta na fun- 
ção de transferência do controlador PID: 


A função de transferência do PID tem 
dois polos, um em z = 1, que garante a “in- 
tegração” do erro, e um polo em z = 0, que 
corresponde a altas frequências. Além dos 
polos, há dois zeros em 


1+H) +VA 
2(1+5+%) 


DEE ndo Tm 
=(1+— | —4 14 | 
5 (+) e ( Es 
Portanto, o polinômio do numerador em (6.25) 


pode ser escrito da seguinte maneira K'(z — 
a)(z — 29) = K'(2? + biz + bo), sendo que 


Pe 
K=K(1+>+=). 


(6.26) 


21,2" 


PRE E 


Assim, dado um polinômio de segundo grau, 
numerador de uma função de transferência, 


na forma K'(22 +b;z +bo) pode-se encontrar 
bo e b; por inspeção. Por fim, a partir de bo e 
b; pode-se obter T; e Tg usando as relações: 


Tbo 
Ty = — 
a bi + 2b0 E 
(Qbo+bi JT? 
T= . (6.27 
(1+2b0+b)T+(2b0+by) Ta ( 


Portanto, uma maneira de sintonizar o 
PID dado em (6.25) é utilizar procedimentos 
tais como o lugar das raízes ou resposta em 
frequência para encontrar valores adequados 
para os zeros em z = 7 ez = ze parao 
ganho K. Como by = 222eb/=-—--—2,,as 
relações em (6.27) podem ser usadas para en- 
contrar Ty e T;. Tendo determinado as cons- 
tantes do PID, a equação de diferenças que 
implementa (6.25) é 


( E Jete 1) + e(k 3). (6.28) 


Existem várias implementações, muitas de- 
las parecidas, do controlador PID, sendo que 
em geral se baseiam nos mesmos princípios 
abordados aqui. 


6.3 Especificações no 
Domínio do Tempo 


O desempenho de um sistema de controle 
pode ser especificado utilizando certas mé- 
tricas ou figuras de mérito que normalmente 
são traduzidas em termos de localização de 
polos dominantes do sistema em malha fe- 
chada. Saber determinar regiões viáveis para 
tais polos a fm de garantir o desempenho 
esperado é fundamental em técnicas de pro- 
jeto, como a que usa o lugar das raízes, ou 
métodos de alocação de polos. Nesta seção 
fornecemos algumas relações que expressam 
desempenho de sistemas em termos de po- 


los dominantes. Quando os polos se referi- 
rem a sistemas de tempo contínuo, a relação 
2 = e” pode ser utilizada a fim de mapear 
os polos no plano s para o plano z. 


Especificações de desempenho em estado 
estacionário devem ser atendidas mediante a 
inserção de integradores na malha de controle 
e ajuste das constantes de erro de posição K,, 
de velocidade K, ou de aceleração K,. 


Para sistemas que em malha fechada se 
comportam aproximadamente como uma fun- 
ção de transferência de segunda ordem sem 
Zeros 


2 


= .2 
(o) s2 + 2Çuns + w2" (0:20) 


em que ( é o quociente de amortecimento, em 
inglês damping ratio, também chamado coe- 
ficiente de amortecimento e w, é a frequência 


natural, tem-se: 
Ma = JOge UM 
= 
(2cv1 = €) (6.30) 
tpwn x ( rd 


E 
| 


em que M, é o sobressinal em %, tp é o tempo 
em que o sobressinal ocorre M, é o pico de 
ressonância. Uma relação aproximada entre 
Mp eçé 


C = 0,6(1— M,/100), (6.31) 


para valores de € = 0,5, ou para Mp =x 15%. 
Uma relação fácil de lembrar é que para ( = 
0,6 Mp = 10%. Se esse for o sobressinal má- 
ximo permitido, então o quociente de amor- 
tecimento não pode ser menor que 0,6. 
Dado M, pode-se determinar 6 (e vice 
versa) graficamente utilizando a Figura 6.12. 


Com respeito a essa figura, é natural inter- 
pretar o traço contínuo como sendo o resul- 
tado exato e a reta pontilhada como uma 
aproximação. Contudo, o leitor deve lem- 
brar que, como o sistema normalmente não é 
como em (6.29), ambas as curvas são aproxi- 
mações. Se o sistema tiver um par de polos 
complexos conjugados dominantes, as referi- 
das aproximações são adequadas. 


Relações aproximadas entre a banda de 
passagem wp e à frequência natural não amor- 
tecida w, são fornecidas por Leigh, que cita 
Truxal, (Leigh, 2006, p. 118): 


1270 - paraç= 05 
Wp E 4 um para (= 0,7 (6.32) 
O,7wn para (= õ0,95. 
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FIGURA 6.12: Sobressinal em função do quo- 
ciente de amortecimento. O traço contínuo 
refere-se à primeira expressão em (6.30) e a 
reta pontilhada à aproximação em (6.31). 


Para um sistema de segunda ordem, pode- 
se verificar a seguinte relação (ver Exercí- 


cio 6.3): 


Wn 


Kx— 
v au 


(6.33) 


em que K, é a constante de erro de veloci- 
dade da malha aberta, ao passo que ( e wn 
referem-se aos polos de malha fechada. 

Note que (6.33) aplica-se a sistemas tipo 1 
em malha aberta e serve para ter uma ideia 
da localização dos polos em malha fechada a 
partir de K,. As constantes de erro de posi- 
ção e de velocidade são determinadas a partir 
de especificações de erro em estado estacio- 
nário e não a partir de relações como (6.33). 


Além disso, as seguinte relações são tam- 
bém conhecidas 


1,8 
Un 2 
br 
4,6 
Ee E (6.34) 


Se tomarmos N como o número de amos- 
tras por período da oscilação não amortecida 
podemos escrever: 


N=ÍDcm=—. (6.35) 


Relacionado a isso, uma outra alternativa 
— que é usada pelo Matlab, conforme pode ser 
visto na Figura 6.7 — é representar a frequên- 
cia na forma 


wn = as 0<a<1, (6.36) 


como feito no Exemplo 6.1.3. 

No caso de sistemas de segunda ordem em 
tempo contínuo como (6.29), é comum repre- 
sentar os polos em termos dos parâmetros ( e 
wn. À seguir desenvolvemos a representação 
de um par de polos complexos conjugados 
de uma função de transferência de segunda 
ordem em z e, para isso, lançamos mão do 
mapeamento z — esT. O objetivo é achar 


relações entre ( e w, e a localização dos po- 
los no plano z. Portanto, como os polos de 


G(s) em (6.29) são s12 = —Gwntwn/1 — 62, 


escrevemos: 
Es el Swntjwny 1-C3T 
e SunT tjunT 1-2 


que está na forma 7rZ + O com 


Z1,2 


r=e “7 dy E wunTV1-C? (rad),(6.37) 


que são duas equações envolvendo as grande- 
zas r, À (rad), C ewn. Após algumas manipu- 
lações algébricas chega-se a (Phillips e Troy 
Nagle, 1995, p. 216): 


—lnr 


4 RE 
E = admito (6.38) 


1 e 


Gun Inr” 


em que a última expressão fornece a taxa 
de decaimento — equivalente à constante de 
tempo — do envelope dentro do qual se dão 
as oscilações provocadas pelo par de polos 
complexos conjugados. 


6.4 Projeto Usando o 
Lugar das Raízes 


Na Seção 5.5 foi apresentada a definição do 
lugar das raízes. Em poucas palavras, esse 
método fornece o lugar geométrico possível 
para os polos de malha fechada, que são as 
raízes da equação característica, à medida 
que um parâmetro qualquer varia de zero a 
infinito. A fim de lançar mão das regras de 
traçado do lugar das raízes, a equação carac- 
terística deve ser escrita na forma padrão in- 
dicada em (5.64). As principais regras foram 
apresentadas na Seção 5.5. 


Na presente seção desejamos discorrer so- 
bre o uso do lugar das raízes no projeto de 
sistemas em malha fechada, ou seja, quais 
são as premissas normalmente consideradas. 
Iustra-se o procedimento com um exemplo, 
em que a ênfase não é o traçado do lugar das 
raízes, mas sim sua interpretação e como ela 
pode auxiliar na tomada de decisão durante 
o projeto. 


Possivelmente o principal alicerce sobre 
o qual se apoia o projeto baseado no lugar 
das raízes é o fato de que o desempenho do 
sistema controlado é determinado fortemente 
pelos polos dominantes de malha fechada. 
Normalmente o número desses polos é pe- 
queno, muitas vezes igual a dois, razão pela 
qual tanta ênfase é dada a sistemas de se- 
gunda ordem e as relações entre a localização 
de seus polos e suas características dinâmicas 
(ver Seção 6.2). Deve ser notado que um sis- 
tema pode ter mais do que dois polos, mas 


se apenas dois forem dominantes, as princi- 
pais decisões de projeto podem ser tomadas 
levando-se em conta esses polos. Determinar 
se um polo é ou não dominante pode não ser 
fácil, mas as duas próximas heurísticas são 
úteis: 


1. polos lentos normalmente são mais do- 
minantes que polos rápidos; 


2. polos sem zeros próximos normalmente 
são mais dominantes que polos com ze- 
ros próximos. 


Portanto, um polo (ou par de polos) lento, 
mas que esteja sob a ação de um zero pró- 
ximo, possivelmente será menos dominante 
que um polo mais rápido, mas que não te- 
nha um zero próximo. Assim, na prática, 
vemos que a dominância de polos (chamada 
dominância modal) deve levar em conta os 
dois aspectos mencionados acima. Índices 


que quantificam a dominância modal para 
sistemas lineares em tempo contínuo foram 
propostos em (Aguirre, 1993), sendo que sua 
aplicação e características podem ser encon- 
tradas em (Aguirre, 2015, Sec. 14.2). 

Como os polos dominantes determinarão 
em grande parte o comportamento do sis- 
tema em malha fechada, é importante saber 
onde é que tais polos devem estar localizados 
de modo a atender as especificações de de- 
sempenho estabelecidas. Por essa razão, as 
relações apresentadas na Seção 6.3 são úteis, 
bem como as características do mapeamento 
2 = e?'s discutidas na Seção 3.3. 

Posto isso, em linhas gerais, um projeto 
usando o lugar das raízes segue as seguintes 
etapas: 


1. determinar as condições necessárias 
para garantir o desempenho em estado 
estacionário desejado. Esta etapa nor- 
malmente determina um ganho mínimo 


ou a necessidade de incluir integração 
no controlador; 


traduzir as especificações de desempe- 
nho transitório desejado para o sistema 
controlado em termos da posição de 
polos dominantes, utilizando relações 
como as apresentadas na Seção 6.3; 


traçar o lugar das raízes variando o pa- 
râmetro escolhido para sintonia (nor- 
malmente o ganho do controlador); 


se o lugar das raízes passar pela região 
determinada no segundo passo, basta 
determinar o valor de ganho que co- 
loca os polos em malha fechada nessa 
região. Verificar se esse valor de ganho 
atende a condição estabelecida no pri- 
meiro passo; 


se as condições mencionadas no item 
anterior não foram satisfeitas, é neces- 


sário mudar a estrutura do controlador: 
acrescentar polos ou zeros, ou mudá- 
los de posição, almejando forçar o lu- 
gar das raízes a passar pela região de 
desempenho desejado. Uma vez alcan- 
çado esse objetivo, deve-se repetir o 
passo anterior. 


Recomenda-se verificar a posteriori, por 
simulação, se o desempenho da malha satis- 
faz os requisitos. Mesmo essa verificação é 
uma aproximação, pois se baseia no modelo, 
mas é um passo importante antes de imple- 
mentar o controlador projetado na planta. 

As etapas descritas acima são válidas 
tanto para sistemas representados em tempo 
contínuo, como em tempo discreto. Além 
disso, o traçado do lugar das raízes é igual 
em ambos os casos. A diferença está no 
passo 2, em que a posição almejada para os 
polos é uma região no plano s para sistemas 
em tempo contínuo, e uma região no plano 


z, para sistemas em tempo discreto. 

Durante todo o procedimento deve-se le- 
var em conta que o projeto pelo lugar das raí- 
zes é aproximado, pois coloca grande ênfase 
nos polos dominantes (os demais polos têm 
influência no desempenho final) e a própria 
equação característica, que é o ponto de par- 
tida do projeto, é um modelo aproximado. 
Portanto, o traçado do lugar das raízes, em 
algumas situações pode também ser aproxi- 
mado sem prejuízo. Isso é ilustrado no pró- 
ximo exemplo. 


Exemplo 6.4.1 


No presente exemplo, desejamos realizar 
o projeto de um regulador para o sis- 
tema tratado no Exemplo 6.1.3. Como 
o projeto agora é realizado utilizando o 
lugar das raízes, uma das primeiras eta- 
pas é determinar no plano z qual é a re- 


gião adequada para os polos de malha 
fechada. Para isso devemos traduzir as 
especificações fornecidas para o sistema 
controlado em termos de regiões no plano 
Pa 

Começamos com a especificação do 
sobressinal, que deve ser no máximo 16%, 
ou seja, Mp — 16, que pela Eq. 6.31 con- 
cluímos que € > 0,5. O tempo de acomo- 
dação máximo deve ser de 10 segundos e 
usando (6.34) temos 


4,6 
RR 


=0,46, (6.39) 


e usando (=0,5 tem-se w,=0,92 rad/'s. 
Usando (6.37) chega-se ao valor do mó- 
dulo dos polos dominantes r=e"148 » 
WosS pos = 

A fim de mapear a frequência no cír- 
culo, é útil descrever w, de uma outra 


maneira. Isso depende do ábaco disponí- 
vel. Em alguns, a frequência é indicada 
em termos do número de vezes que um 
sinal senoidal com frequência w, é amos- 
trado ao longo de um período. Esse nú- 
mero é dado por é N = 27/wnT, que 
neste caso é N = 27/0,92 = 7, pois 
T = 1. Em outros ábacos (como o do 
Matlab) as indicações de frequência es- 
tão em termos de frequência mesmo, mas 
escritas na forma Bh 0O<a< 1. Por- 


tanto, escrevemos w, = = Lo No pre- 
an 0927 4 097 
sente caso temos wn = = 5 * 0,35. 


Portanto, indica-se no ábaco a região 
dada por wn > 0,97, 7 <0,63e6 > 0,5 
como ilustrado na Figura 6.13. Vale no- 
tar que a restrição referente ao módulo 
dos polos dominantes neste caso é redun- 


dante com as outras restrições. 
Utilizando a restrição K, > 1 e a defi- 
nição da constante de erro de velocidade 


(ver Eq. 6.6), temos para o sistema com 
controlador meramente proporcional, ou 
seja, para D(z) = K: 

ad 
K,= lim =>(2z—- DKG(2) 21 

251 T 
0,0484(z + 0,9667) 


= DK Sil 
a CE 
=K0,999>1..K2>1, (6.40) 


ou seja, o controlador deve ter ganho CC 
maior ou igual a um para atingir a espe- 
cificação do erro de velocidade. 
Primeiramente, devemos avaliar se 
apenas fechando a malha é suficiente 
para atender as demais especificações de 
controle, uma vez que para K > 1 a res- 
trição (6.40) é atendida. Para isso traça- 
mos o lugar das raízes para o sistema não 
compensado, ou seja, D(z) = K, como 


mostrado na Figura 6.14. Dessa figura 
nota-se que o lugar das raízes dos polos 
dominantes do sistema não compensado 
não passa na região selecionada. Por- 
tanto, é necessário inserir um compen- 
sador para permitir que os polos domi- 
nantes de malha fechada estejam dentro 
da referida região. 
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FIGURA 6.13: Ábaco no plano z para 
projeto baseado no lugar das raízes. As 
curvas indicadas correspondem a: w, = 
0,37 (tracejado longo), € = 0,5 (trace- 
jado curto) er == 0,63 (contínuo). A 
região aceitável para os polos está hachu- 
rada. 


A abordagem seguida neste exemplo 


é intuitiva e algumas contas são aproxi- 
madas, a fim de ilustrar o potencial do 
uso do método. Ao final, o compensador 
projetado é simulado em computador a 
fim de validá-lo. 

Intuitivamente, a fim de puxar o lugar 
das raízes para dentro do círculo de raio 
unitário, devemos aproximar um zero pela 
esquerda do polo em z = 0,9. Uma classe 
útil de reguladores consiste de funções 
de transferência com um zero e um polo, 
como apresentado na Seção 6.2.1. Assim, 
devemos também escolher a localização 
de um polo, que é colocado à esquerda do 
zero do regulador, por razões que se tor- 
narão claras. Para fins ilustrativos, con- 
sideremos tentativamente o regulador 


z— 0,8 


RR a e 


(6.41) 


que é do tipo avanço de fase (ver Eq. 6.16 
e discussão). Lembre-se que no plano z a 
região em torno de z = 1 corresponde a 
baixas frequências e o segmento real ne- 
gativo entre a origem e o ponto z = —1 
corresponde a altas frequências. Isso sig- 
nifica que o regulador Di;(z) em (6.41) 
tem um zero em frequência mais baixa 
que o polo, ou ainda, Di(z) é mesmo um 
regulador do tipo avanço de fase. A Fi- 
gura 6.15 mostra o lugar das raízes do 
sistema compensado com Di(z). Nesse 
caso o ajuste do ganho do regulador deve 
ser feito de modo a garantir a restrição 
da constante de erro de velocidade, ou 
seja, 


Ky, 


1 — 0,8) 0,0484 0,9667 
lim =(2-DKp, E ) (at ) > 
P (2-0,05) (2-1)(2-0,9048) 


Hp 09999 1, 
210,95 * 


va = HT. (6.42) 
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FIGURA 6.14: Lugar das raízes para o 
sistema com D(z) = K, em que K é va- 
riado para gerar o traçado. 


Para esse valor de ganho, os polos de 
malha fechada encontram-se aproxima- 
damente em z = 0,68 e z = 0,52 + 50,23. 
Deve-se notar que agora há três ramos no 


lugar das raízes, pois o regulador contri- 
bui com um deles. Parte do terceiro ramo 
está sobre o eixo real fora da região indi- 
cada para os polos de malha fechada (ver 
Figura 6.13), sendo que para Kp, = 4,75 
os três polos de malha fechada estão fora 
da região desejada. Analisando o lugar 
das raízes, nota-se que não é viável co- 
locar esses polos dentro da região dese- 
jada apenas ajustando-se o ganho. O 
que pode ser feito, contudo, é ajustar o 
compensador para que os ramos de polos 
complexos passem por essa região. Uma 
questão importante é que tais ramos e 
sejam dominantes. Assim, não teremos 
que nos preocupar com o polo real. 


Imag 


FiGURA 6.15: Lugar das raízes para o 
sistema com Dy(z) dado em (6.41) e va- 
riando Kp, para gerar o diagrama. Para 
Kp,=4,75 os polos de malha fechada são: 
2=0,68e2z= 0,52 + 30,25. 


Ao usar Di(z) em (6.41), o polo de 
malha fechada real é dominante, o que 
resulta em uma resposta mais lenta do 


que o desejado. Uma forma de reduzir 
sua dominância é aproximar o zero ainda 
mais do polo de malha aberta, pois nesse 
caso, como visto abaixo, o polo real de 
malha fechada fica próximo a um zero. 
Lembre que zeros de ramo direto são tam- 
bém zeros de malha fechada em proble- 
mas de rastreamento (veja Eq. 6.10). As- 
sim, consideramos um novo regulador de 
avanço de fase 


lime Úe oi 


JD) = JS 
(2) = Kp ER 


(6.43) 
em que o zero foi deslocado um pouco 
mais para a direita e deixamos a discus- 
são da localização do polo para depois. 
O efeito de aproximar o zero do polo em 
z = 0,9é0 de fechar o lugar das raízes em 
torno de si, como ilustrado esquematica- 
mente na Figura 6.16. Como consequên- 


cia, nessa configuração, o polo de malha 
fechada está muito mais próximo do zero 
comparado ao que acontecia com o regu- 
lador Di(z). Assim, esse polo perde do- 
minância e podemos dedicar atenção aos 
ramos do lugar das raízes corresponden- 
tes ao polos complexos. 

Agora precisamos determinar a loca- 
lização do polo do regulador. Para isso 
usamos os seguintes argumentos geomé- 
tricos. Um ramo do lugar das raízes sai 
do polo a ser alocado em z = p bem à 
esquerda do zero em z = 0,88. Assim, 
o ramo com origem nesse polo avança 
para a direita em direção ao ramo que 
vem do “ponto de chegada” em z = 0,82 
(ver Figura 6.16). É fundamental no- 
tar que o lugar das raízes tem um ponto 
de partida entre z = pe z = 0,82 em 
que os ramos formam uma circunferên- 
cia com centro aproximado no zero em 


z = 0,97 (veja Figura 6.17). Portanto, 
devemos escolher p de modo que esses no- 
vos ramos passem confortavelmente pela 
região desejada. Escolhemos tentativa- 
mente p = —0,3. Logo 


= OBS 
2z+0,3. 


DIC) o (6.44) 


FIGURA 6.16: Detalhe do lugar das raí- 
zes para o sistema com D(z) dado em 


(6.44). 


Procedendo como anteriormente para 
determinar o ganho 
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FIGURA 6.17: Lugar das raízes para o 
sistema com D(z) dado em (6.44) vari- 
ando Krp para gerar o diagrama. Com 
Kp = 10,5 os polos de malha fechada 


encontram-se aproximadamente em z = 
0,88 ez =0,11+ 30,41. 


Escolhendo Kp = 10,5 (ver Exer- 
cício 6.8), os polos de malha fechada 


encontram-se aproximadamente em z = 
0,88 e z = 0,11 + 50,41, portanto den- 
tro da região delimitada. O lugar das 
raízes da malha fechada com (6.44) está 
mostrado na Figura 6.17. A resposta ao 
degrau e à rampa do sistema em malha 
fechada para cada um dos casos vistos no 
exemplo são mostrados na Figura 6.18 e 
na Figura 6.19, respectivamente. Como 
pode ser visto, os requisitos de controle 
foram alcançados. 

Por fim, desejamos analisar o desem- 
penho dos sistemas projetados em pro- 
blema de regulação (ver Seção 6.1.2). Pelo 
fato de a função de transferência de ma- 
lha ser do tipo 1, sabemos que o ganho CC 
em malha fechada da referência para a 
saída é unitário. Em outras palavras, o 
erro em estado estacionário para entra- 
das em degrau é nulo (ver Seção 6.1.1). 


FIGURA 6.18: Resposta em ma- 
lha fechada ao degrau unitário c(k) 
(— + —) não compensado, (— o —) com 
o compensador (6.41) e Kp, = 475 e 
(— * —) com o compensador (6.43) e 
Kp = 10,5, para o qual o máximo so- 
bressinal é 14,5%. Os valores foram in- 
terpolados para ajudar a visualização. 


O erro estacionário da função de trans- 
ferência de malha fechada, do distúrbio 
para a saída (ver Eq. 6.12) para o regu- 
lador (6.42) é: 


Do Dp;(DNe(1) 
(1) Dp(DDe(1) + No; (DNe(1) 
' (1 — 0,05)0,0484(1 + 0,9667) 
(1— 0,05)0 + 4,75(1 — 0,8)0,0484(1 + 0,9667) 
— 00904 
0,0904 


sq 


e para o regulador (6.44) é: 


Ci Dp(DNe(l) 
Wa)  Dp(DDe(1) + No(DNe(1) 
(1 + 0,3)0,0484(1 + 0,9667) 


“ (1+0,3)0 + 10,8(1 — 0,88)0,0484(1 + 0,9667) 


0,1237 
= = 1,3684. 
0,0904 
Em k = 25 aplica-se um distúrbio 


em degrau de amplitude -0,3, ou seja, 


W(z) = —0,382/(z — 1). Como o ga- 
nho CC C(1)/W(1) £ 0 em ambos os 
casos, nenhum desses reguladores é ca- 
paz de rejeitar distúrbios em degrau, pois 
para isso o ganho CC deve ser nulo. O 
efeito em estado estacionário do distúrbio 
no primeiro caso é 03x 1 = 0,3 e,no 
segundo, —0,3 x 1,3684 = —0,41. Por- 
tanto, o estado estacionário da malha no 
primeiro caso é c(00) = 1—0,3 = 0,7 e, no 
segundo, c(00) = 1 — 0,41 = 0,59, como 
pode ser constatado na Figura 6.20. 


FIGURA 6.19: (—) A rampa unitária. 
Resposta à rampa unitária c(k) do sis- 
tema em malha fechada: (— + —) não 
compensado, (— o —) com o compensa- 
dor (6.41) e Kp, = 4,75, para o qual 
o erro em estado estacionário é 1,0005 
e (— * —) com o compensador (6.43) e 
Kp = 10,5, para o qual o erro em estado 
estacionário é 1,045. 


Um último aspecto que deve ser co- 
mentado neste exemplo diz respeito ao 
tempo de acomodação do sistema com 
regulador (6.44). Lembre-se que como o 
regulador (6.42) estava um pouco lento, 
decidiu-se aproximar o zero do regulador 
do polo de malha fechada real — que é 
mais lento — de modo a torná-lo menos 
dominante e, assim, ter uma resposta de 
malha mais rápida. Contudo, como pode 
ser constatado de (6.12) o zero do contro- 
lador não é um zero da malha fechada do 
distúrbio para a saída (veja Figura 6.1), 
ao contrário do que ocorre na malha fe- 
chada da referência para a saída. As- 
sim, o efeito de cancelamento polo-zero 
que ocorre em C(z)/R(z) não ocorre em 
C(z)/W(z) e o polo lento da malha fe- 
chada tem maior influência nesta do que 
naquela. Portanto, é esperado que a res- 
posta ao distúrbio do sistema com regu- 


lador (6.44) seja mais lenta e sem “sobres- 
sinal” do que sua resposta a variações na 
referência. Isso também pode ser clara- 
mente constatado na Figura 6.20 (Exercí- 
cio 6.7). Outro aspecto interessante ilus- 
trado na Figura 6.20 é o fato de que neste 
exemplo está claro que a melhora no se- 
guimento de trajetória — problema de ser- 
vomecanismo — resulta em uma piora na 
regulação, uma vez que após o distúrbio 
o erro em estado estacionário aumenta. 


FIGURA 6.20: Desempenho dos sistemas 
projetados. (— o —) com o compensa- 
dor (6.41) e Kp, = 475 e (— *—) com 
o compensador (6.43) e Kp = 10,5. O 
distúrbio ocorre em k = 25. 


6.5 Projeto no Domínio 
de Frequência 


Na Seção 5.3 foi visto que o critério de es- 
tabilidade de Nyquist permite determinar a 
estabilidade do sistema em malha fechada a 
partir da resposta em frequência da malha, 
desde que o número de polos instáveis de ma- 
lha aberta seja conhecido a priori. De fato, 
não apenas a estabilidade, mas o desempe- 
nho do sistema em malha fechada é o resul- 
tado da resposta em frequência da malha, um 
fato explorado no projeto com a carta de Ni- 
chols (ver Sec. 5.4). Por essa razão, o pro- 
jeto de controladores no domínio de frequên- 
cia pode ser visto como o procedimento pelo 
qual a resposta em frequência de malha é 
ajustada de maneira a garantir as especifi- 
cações de projeto. O termo em inglês loop 
shaping reflete a ação de conformar a res- 
posta em frequência da malha aberta. Nesta 


seção alguns dos princípios elementares que 
regem tal conformação são discutidos. 

Algumas das primeiras contribuições de 
caráter fundamental foram realizadas por 
Hendrik Bode na primeira metade do sé- 
culo XX para sistemas em tempo contínuo. 
A título de curiosidade histórica, menciona- 
mos que Bode escreveu a seguinte expressão 
para sistemas de fase mínima e sem atraso 
puro de e (Bode, 1945, p. 313): 


B(wo) = — s log asa “au, (6.46) 
em que B ao Ra ao deslocamento 
de fase na frequência wo, sendo u = log w/wo, 
e A é a amplitude da resposta em frequência 
em dB. Portanto, OA/du é a inclinação do di- 
agrama de Bode e essa grandeza, ponderada 
pela função log coth(-), determina o defasa- 
mento B(wo). 

Dois importantes princípios que são con- 
sequência do resultado (6.46) proposto por 


Bode são: i) para sistemas de fase mínima 
a menos de uma constante, o ganho de 
malha determina unicamente a fase e vice- 
versa; ii) se 04/du for aproximadamente 
constante para uma certa faixa do logaritmo 
de frequências!- da ordem de uma década-, 
ou seja, O4/du = k20dB/dec, a fase pode 
ser aproximada por: 


AOS ks rad. (6.47) 


Por exemplo, seja G(jw) a resposta em 
frequência de malha. Se no diagrama de 
Bode (escala log-log), 9|G(jw)|/Ologw = 
—40dB/dec para valores de w ao longo de 
uma década, centrada em torno de uma de- 
terminada frequência wo, então ZG(jwo) = 
— 180º. 

Do critério de estabilidade de Nyquist 
sabe-se que para que o sistema em malha 


!Note que o que importa é O4/Ôu e não 04/0w. 


fechada seja estável, assumindo que o sis- 
tema em malha aberta é estável, é necessário 
que a fase seja maior que — 180º na frequên- 
cia de cruzamento, ou seja, na frequência tal 
que |G(jw.)| = 0dB. Contudo, pela expres- 
são (6.47) é possível perceber que se a in- 
clinação da curva de ganho em torno de wc 
for, por aproximadamente uma década, cons- 
tante e com valor em torno de -40dB/dec, 
a fase estará perigosamente perto de — 180º. 
Assim, uma recomendação de projeto, que 
visa garantir uma boa margem de fase é 
ajustar a resposta em frequência de maneira 
que na frequência de cruzamento a inclina- 
ção do ganho no diagrama de Bode seja - 
20dB/dec. Esses princípios aplicam-se igual- 
mente ao caso de sistemas de tempo contínuo 
e de tempo discreto, lembrando que no caso 
discreto não é possível, em geral, aproximar 
a resposta em frequência por assíntotas. 


Exemplo 6.5.1 


Neste exemplo consideramos a função de 
transferência de pulsos em tempo dis- 
creto (7 = 0,1) dada por 


0,017522 + 0,0153z 
23 — 2,6397522 + 2,3078z — 0,6703' 


G(a) = (6.48) 
A resposta em frequência desse sis- 
tema está mostrada na Figura 6.21. 
O primeiro segmento de reta trace- 
jado indica uma região de duas déca- 
das em que a inclinação é aproximada- 
mente —20dB/dec. Conforme previsto 
por (6.47), a fase no “ponto central” 
aproxima-se de —7/2. No caso do se- 
gundo segmento de reta, a inclinação é 
de aproximadamente —60 dB /dec e a fase 
correspondente começa a se aproximar de 
—37/2. No segundo caso, a aproximação 
é pior por dois motivos. Em primeiro 


lugar, a inclinação constante não se es- 
tende por uma década completa. Em se- 
gundo, como esse segmento de reta está 
próximo à máxima frequência permitida, 
o diagrama começa a sofrer distorções tí- 
picas de sistemas em tempo discreto em 
frequências próximas a ws/2. 

Como na frequência de cruzamento a 
fase é mais negativa que —180º, o sis- 
tema em malha fechada é instável. Ou- 
tra forma de inferir esse resultado é no- 
tar que a resposta em frequência cruza a 
linha de OdB com inclinação próxima a 
—60dB/dec. A compensação desse sis- 
tema é discutida no próximo exemplo. 


Magnitude (dB) 


Fase (deg) 


-P70b I E 1 E 
10º 101 10 10 10 
Freq. (rad/s) 


FiGURA 6.21: Resposta em frequência 
do sistema (6.48). As linhas tracejadas 
mostram regiões de inclinação aproxima- 
damente constante e as setas indicam a 
fase correspondente aproximadamente ao 
ponto médio dos respectivos segmentos 
de reta. 


Exemplo 6.5.2 


Neste exemplo voltamos a considerar a 
função de transferência (6.48). A res- 
posta em frequência desse sistema está 
indicada em curva tracejada na carta de 
Nichols da Figura 6.22, em que se per- 
cebe que o sistema em malha fechada é 
instável, uma vez que essa curva passa 
por cima e à esquerda do ponto crítico 
(— 180º, 0 dB), indicado por uma pequena 
oba, 

Comecemos com um controlador pro- 
porcional com ganho constante K. De- 
sejamos encontrar o valor de K de ma- 
neira a alcançarmos uma margem de fase 
de 60º, ou seja, desejamos que a fase 
do sistema compensado na frequência de 
cruzamento (por OdB), seja —120º. Na 
Figura 6.22 foi traçada uma linha cor- 
respondente a 0dB de ganho em malha 


aberta. Procuramos a fase —120º no 
eixo horizontal e medimos o ganho do 
sistema não compensado, que é aproxi- 
madamente 25dB (veja o segmento de 
reta vertical na Figura 6.22). Portanto, 
é necessário reduzir o ganho de 25dB 
para que o cruzamento por 0dB ocorra 
no ponto desejado. Reduzir o ganho de 
25 dB corresponde a multiplicar o ganho 
por 56 = 

Com esse ajuste de ganho, a res- 
posta em frequência de malha aberta do 
sistema compensado é indicada na Fi- 
gura 6.22 pela curva contínua. A banda 
passante do sistema pode ser obtida pro- 
curando para que frequência a nova res- 
posta em frequência cruza o círculo M 
correspondente a —3 dB. Essa frequência 
é wp = 0,9rad/s. O tempo de acomo- 
dação é de aproximadamente t, = 8s e 


o tempo de subida, t, = 3s (ver Exercí- 
cio 6.9). 

A malha aberta tem polos em z = 1 
e z = 0,8187 (multiplicidade 2). Como 
T = 0,1 os polos de multiplicidade dois 
correspondem a constantes de tempo de 
0,5. Um tempo de acomodação de 8s 
é bastante longo. Esse é o resultado da 
significativa redução da ganho necessária 
para alcançar a desejada margem de fase 
com um controlador meramente propor- 
cional. Outra consequência é a redução 
da constante de erro de velocidade. A 
fim de alcançar margem de fase e redu- 
zir o tempo de acomodação (aumentar a 
banda passante da malha fechada) é ne- 
cessário utilizar compensadores dinâmi- 
cos. 


0dB 


Ganho (malha aberta) (dB) 


-180 -135 -90 -45 (o) 
Fase (malha aberta) (deg) 


FiGURA 6.22: Carta de Nichols para o 
sistema (6.18) não compensado (curva 
tracejada), e com o uso de um contro- 
lador puramente proporcional com K = 
1/18 (curva contínua). 


Nos casos em que o ajuste de ganho não 
é suficiente para garantir o desempenho re- 


querido do sistema em malha fechada, deve- 
se alterar a resposta em frequência pela adi- 
ção de um compensador na malha. Alguns 
compensadores clássicos foram apresentados 
na Seção 6.2. Esse tipo de procedimento foi 
seguido nos exemplos 6.1.3 e 6.4.1 seguindo 
filosofias distintas (veja Exercício 6.10). 


6.6 Métodos de 
Síntese Direta 


Os métodos de síntese direta são também co- 
nhecidos como métodos algébricos. A moti- 
vação é encontrar a expressão algébrica para 
a função de transferência em malha fechada 
e igualá-la a um modelo de referência pro- 
curando, em seguida, explicitar a função de 
transferência para o controlador. Uma difi- 
culdade desse procedimento é que a menos 
que o modelo de referência pertença a uma 


certa classe de funções, que depende da es- 
trutura da função de transferência da planta 
e do controlador, esse procedimento não tem 
solução exata. Alguns aspectos do procedi- 
mento estão descritos a seguir. 


A função de transferência em malha fe- 
chada do sistema de controle mostrado na 
Figura 6.23 é: 


É gos as im ES Es EEE ui om: E (ES (6 q (ES ES 


FIGURA 6.23: Sistema discreto em malha 
fechada. D(z) pode ser projetado de maneira 
que o sistema indicado pela linha tracejada 
se comporte de acordo com um modelo de 
referência T(2z). 


Deseja-se projetar D(z) de tal maneira 
que o sistema controlado alcance certas espe- 
cificações de desempenho. Suponha que tais 
especificações sejam atendidas por uma fun- 
ção de transferência chamada de modelo de 
referência: T(z). Assim, o controlador D(z) 
dever ser tal que 


ou seja, 


T() +T(2)D(2)G(z) = D(2)G(z) 
Te) = Dile(o) — T()G(2)] 
= T(z) 
Po = ouro 6 


À expressão (6.50) dá origem a vários pro- 
cedimentos de projeto do controlador discreto. 
Como D(z) é obtido pelo cálculo indicado em 
(6.50), essa classe de técnicas é chamada de 
métodos de síntese direta. O que diferencia 
os métodos dessa classe é a maneira de esco- 
lher T(z), contudo algumas recomendações 
gerais devem ser sempre observadas: 


1. D(z) não deve cancelar tempo morto, 
ou seja, se a planta tiver tempo morto, 
T(z) deve incluí-lo; 


2. D(z) não deve cancelar zeros de fase 
não mínima, ou seja, se a planta tiver 
zeros de fase não mínima, T(z) deve 
incluí-los; 


3. T(z) não deve ser muito exigente. 


Essas recomendações visam a que D(z) 
seja causal (realizável) e estável. A seguir são 
apresentados alguns métodos diretos para o 
projeto de controladores digitais. 


6.6.1 O controlador dead-beat 


O projeto de controle usando controlador 
dead-beat objetiva que a resposta ao degrau 


do sistema controlado seja c(k) = 1, k = 
1,2,..., ou seja, 
Co) = glyga4.. 
= [Prolpe?+r]-do=S (ea 
n=0 
1 1 
= 1= lertj<a. 6.51 
= o | (6.51) 


Chegamos ao resultado acima reescre- 
vendo a resposta desejada na forma de uma 
série e lançando mão do resultado (2.31), vá- 
lido no caso de haver convergência da série. 


A região de convergência é dada por |z!| < 
1. Poderíamos chegar ao mesmo resultado, 
observando que c(k) é um degrau unitário 
atrasado de 1, portanto z/(z — 1) x 71 = 
1/z— 1. Assim, a resposta ao degrau em ma- 


lha fechada desejada é: 
C(z) = T(z)R(z) 
=D) 


z-—1 
Tee 4 (6.52) 


ou seja, o modelo de referência é simples- 
mente um atraso de um intervalo de amostra- 
gem. Substituindo (6.52) em (6.50) obtém-se 


o controlador dead-beat: 
= 


De aos 
aa Can 
G(o)(z — 1) 


Em linhas gerais, o controlador D(z) de- 
terminado em (6.53) cancela a dinâmica da 


planta e impõe a dinâmica desejada. Note 
que o numerador de D(z) é composto pelo 
denominador de G(z), ou seja, o numera- 
dor do controlador procura “cancelar os po- 
los da planta”. Com respeito a essa observa- 
ção há dois aspectos que devem ser notados. 
Esse projeto só garante que a resposta seja 
c(k) = 1, k = 1,2, .... nos instantes de amos- 
tragem, sendo possível que a variável contro- 
lada em tempo contínuo c(t) seja bem dife- 
rente entre os valores amostrados. A quali- 
dade do controlador projetado depende dire- 
tamente da qualidade do modelo G(z) e da 
viabilidade de se impor a dinâmica do mo- 
delo de referência T(z). Esses aspectos são 
ilustrados no próximo exemplo. 


Exemplo 6.6.1 


Voltamos a considerar a planta do Exem- 
plo 6.4.1 que, junto com o ZOH, é des- 


crita pela função de transferência de pul- 
sos: 
0,0484 0,9667 
ef pa aa ad A 
(z—1)(2—0,9048) 


(6.54) 


Neste exemplo desejamos projetar um 
controlador dead-beat para essa planta, 
e simular o sistema controlado. Assim, 
usando (6.53) chega-se a: 


T(2) 
G()l — T(2)] 
(z — 1)(z — 0,9048) 1 
0,0484(z + 0,9667) (2 — 1) 
20,6612(2 — 0,9048) 


E (2 +0,9667) furta) 


DIA = 


O desempenho em malha fechada uti- 
lizando o controlador D(z) em (6.55) é 
mostrado na Figura 6.24. O código Ma- 


tlab utilizado para calcular o compensa- 
dor D(z) é: 


4 modelo da planta com ZOH: G(z) na Eq. 6.54 
num=0.0484+[1 0.9667]; % numerador 
den=conv([1 -1], [1 -0.9048]); Y denominador 
Gz=tf (num,den); ) função de transferência 
% compensador D(z) usando Eq. 6.53 

4 D(z) é o inverso da planta com 

% mais um polo em z=1 

% o numerador de D(z) é 

4 o denonminador de G(z) 

numd=den; 

4 acrescenta um polo em z=1 

dend= [num 0]-[O num]; 

) forma a função de transferência de D(z) 
Dz=tf (numd,dend) ; 


A Figura 6.24 foi gerada a partir de 
Dz (ver última linha do código) seguindo 
a lógica detalhada no código abaixo: 


Y% malha aberta 

OLz = series(Dz,Gz); 

Y% malha fechada 

CsRz = feedback(0Lz,1); 

Numd = CsRz.numl; 

Dend = CsRz.denl; 

k = 0:50; Y contador de tempo discreto 
4% resposta ao degrau da malha fechada 
ydb = dstep(Numd,Dend,length(k)); 


4% erro e2 = 1-ydb; 

% acao de controle (discreta) 
u2 = dlsim(numd,dend,e2); 

% acao de controle apos o Z0H 
[t,u2zoh] = zoh2(02,0,1,1)s 
plot (k,u2,ºk*?,t,u2zoh,ºk?) 


4% saida da planta em tempo continuo 

yc2 = lsim(numc,denc,u2zoh,t); 
stem(k,ydb,?k?) 

axis([k(1) k(end) min(ydb)-0.1 max(ydb)+0.5]) 
hold on 

plot(t,yc2); 

hold off 


Nesse código é importante notar que 
tanto se simula a malha fechada em temo 
discreto — usando o modelo em tempo 


discreto e o comando dstep — como a ma- 
lha em temo contínuo — usando o modelo 
em tempo contínuo e o comando lsim. 
Como a saída do controlador, a ação de 
controle em tempo discreto m(k) é uma 
sequência de números, deve-se gerar o si- 
nal “contínuo” correspondente, m(t) pas- 
sando m(k) pelo segurador de ordem zero 
— usando o comando zoh2. A saída da 
malha fechada para uma entrada em de- 
grau é a saída da planta quando a en- 
trada for m(t). 


2) im mm pm 
Am 


FIGURA 6.24: (a) os asteriscos indicam 
a ação de controle m(k) do controlador 
dead-beat (6.55), sendo que o traço con- 
tínuo é a saída do ZOH, m(t) e (b) saída 
controlada, sendo que o traço contínuo é 
a saída da planta c(t) e os círculos são 


ellos 


A saída do sistema nos instantes amos- 
trados é precisamente um degrau unitá- 
rio atrasado de um período de amostra- 
gem, como pode ser visto pelos círculos 
na Figura 6.24b. Contudo, a saída da 
planta c(t) oscila vigorosamente entre os 
instantes de amostragem e a ação de con- 
trole é fortemente chaveada e requer va- 
lores elevados da ação de controle. Isso 
é a consequência de um modelo de refe- 
rência muito exigente. Do ponto de vista 
matemático, o controlador D(z) tem um 
polo em z = —(,9667 — que tem sua ori- 
gem no zero da função de transferência 
de pulsos —, responsável pelo forte chave- 
amento. Tal polo é conhecido como rin- 
ging pole. 

A intuição sugere que, se especificar- 
mos um T'(z) menos exigente, consegui- 
remos ações de controle menos severas e 
a saída da planta será menos oscilatória. 


Tal intuição, de fato, se verifica. O mé- 
todo descrito na próxima seção visa ao 
projeto de D(z) usando um T(z) menos 
exigente. 


6.6.2 O método de Dahlin 


No método de Dahlin (Dahlin, 1968), em vez 
de escolher C(z) como em (6.51), procura-se 
definir uma saída que reduza a exigência so- 
bre o controlador. Em particular, almeja-se 
que a resposta ao degrau unitário do sistema 
controlado seja equivalente a: 


C E 6.56 

O (Trs+I)s 18.06) 

Em palavras, o modelo de referência deve 
comportar-se como um sistema de primeira 
ordem com atraso puro de tempo. Escolhendo 
Ta = nT,n € IN e tomando a transformada 


Z tem-se (ver Exercício 6.4): 


(1 no RC Edi 
1-2D( —e-TtTg-1) 
(1 no ESUP 


= EDGE) (657) 


Cs) = 


Portanto, o modelo de referência é dado 
por 


T(2) RO) 
o (I-eTydn z-1 
— de-D(e=-eT) x 
o et 2" 
T(2) = — = = , (6.58) 


em que 7 en são parâmetros de sintonia que 
devem ser escolhidos pelo projetista. Por fim, 


o controlador é dado por 


(6.59) 


T(2) 
PO = son-To) 
sro! (1-eT/M)zm 
G(z) (e- e TD) - (Ie TI) 
1 (1-e-T/7) 
( 


G 2) gn+l  e-T/Tan — (a Za eTIm) 


É interessante notar que o controlador de 
Dahlin tem um polo em z = 1 paran = 
0 en = 1 (ver Exercício 6.5). Os princi- 
pais comentários feitos sobre o controlador 
dead-beat continuam válidos para o controla- 
dor de Dahlin. Este, à semelhança daquele, 
também é baseado no cancelamento da dinã- 
mica da planta, o que requer um bom mo- 
delo G(z). Também, o presente método só 
considera os valores da variável controlada 
nos instantes de amostragem. A vantagem 
do método de Dahlin comparado ao de dead- 
beat é que pode relaxar as exigências sobre 
o controlador, por meio da escolha de 7. O 


valor de n nunca deve ser menor que o atraso 
da planta, caso haja. 


Exemplo 6.6.2 


Voltamos a considerar a planta do Exem- 
plo 6.6.1. Para começar escolhemos n = 
0, pois a planta não tem atraso, eT = 5s, 
o que resulta no modelo de referência 
0,18127 
T(2) = ——>—w—», (6.60 

(2) z— 0,81873 
cuja resposta ao degrau unitário está mos- 
trada na Figura 6.25 juntamente com a 
resposta do modelo de referência para o 
caso do controlador dead-beat. 
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FIGURA 6.25: Os asteriscos indicam a 
resposta ao degrau de T(z) dada em 
(6.60). Os círculos são a resposta do mo- 
delo de referência para o caso do contro- 
lador dead-beat. 


Está claro que o modelo de referência 
em (6.60) é menos exigente que no caso 
do projeto dead-beat. O código Matlab 


utilizado para gerar a Figura 6.25 é: 


T=1; ) tempo de amostragem 

% definição do modelo de referência 
4% constante de tempo dominante da MF 
tau=5; 

4% atraso da MF 

n=0; 

) numerador de T(z) em (6.58) 
numT=1-exp(-T/tau); 

% denominador de T(z) 

denT=[[1 -exp(-T/tau)] zeros(1,n)]; 
k=0:25; Y vertor de tempo discreto 
4% resposta ao degrau 

yT=dstep (numT,denT,length(k)); 


4% gráfico das respostas ao degrau 

% dos modelos de referência 
stem(k,ydb(1:length(k)),?k?) Y dead-beat 
axis([-1 25 -0.1 1.1]) Y ajuste de eixos 
hold on 

stem(k,yT,?b*?); Y do método de Dahlin 
xlabel(?k?) 

hold off 


Portanto, usando (6.59) tem-se: 


ne e (2 — 1)(z — 0,9048) (1 = 6) 
0,0484(z + 0,9667) z— e—1/5 — 1 + e-1/5 
— 0,904 
= O 


0,0484(z + 0,9667) 
3,7459(2 — 0,9048) 
(z + 0,9667) 


(6.61) 


O desempenho em malha fechada uti- 
lizando o controlador D(z) em (6.61) é 
mostrado na Figura 6.26. Note como 
a ação de controle tem amplitude mais 
baixa do que no caso do controlador 
dead-beat, mas ainda é bastante chaveada 
e como a saída da planta não difere muito 
da saída do modelo discreto, ou seja, c(t) 
não se afasta dos valores de c(k) entre os 
instantes de amostragem. 
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FIGURA 6.26: (a) ação de controle 
m(k) do controlador (6.61) projetado 
pelo método de Dahlin com 7T=5 e n=0 
e (b) saída controlada, sendo que o traço 
contínuo é a saída da planta c(t) e os cír- 
culos são c(k) para D(z) dado em (6.61). 


O código Matlab utilizado para cal- 
cular D(z) é: 


% controlador Dahlin 

Y% numerador de (6.59) 
numd=den*(1-exp(-T/tau)); 

4 a menos de G(z), segue o denominador 
h de (6.59) 

aux=[1 -exp(-T/tau) zeros(1,n)] 
aux=aux-[zeros(1,nt+1) (1-exp(-T/tau))]; 
) inclui o numerador de G(z) 

% ao denominador de D(z) 
dend=conv (num, aux) ; 

% função de transferência em (6.61) 
Dz=tf (numd,dend) ; 


Deve ser notado que em (6.61) houve 
o cancelamento do zero em z = 1, com 
um polo no mesmo lugar. Esse cancela- 
mento não é realizado no código acima, 
em que tanto numd como dend são po- 


linômios de segunda ordem. 


A fim de constatar o efeito da escolha 
de n e 7, voltamos a projetar o contro- 


lador, mas agora com n = 1le7T =2s. 


Nesse caso, o controlador projetado é: 


DEN e (z — 1)(z — 0,9048) (Em 2) 
0,0484(z + 0,9667) 22 — e-1/22 —- 1 fe-1/2 
 (2-1)(z— 0,9048) 0,3935 
0,0484(z + 0,9667) 22 — 0,6065z — 0,3935 


8,1295(z — 0,9048) 
(z + 0,9667)(z + 0,3935) ' 


(6.62) 


cujo desempenho pode ser visto na Fi- 
gura 6.27. 
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FIGURA 6.27: (a) ação de controle 
m(k) do controlador (6.62) projetado 
pelo método de Dahlin com T7=2 e n=1 
e (b) saída controlada, sendo que o traço 
contínuo é a saída da planta c(t) e os cír- 
culos são c(k) para D(z) dado em (6.62). 


Como esperado, à medida que o mo- 
delo de referência torna-se mais exigente, 
a saída da planta entre os instantes de 
amostragem torna-se oscilatória. Para 
fins de comparação mostra-se na Fi- 
gura 6.28 a resposta ao degrau do sistema 
em malha fechada com o controlador pro- 
jetado pelo lugar das raízes na Seção 6.4. 
Percebe-se que a ação de controle e con- 
sequentemente a resposta da planta são 
mais suaves do que no caso do controla- 
dor dead-beat ou de Dahlin. A principal 
razão para isso é que o projeto pelo lugar 
das raízes realizado não se fundamentou 
no cancelamento da dinâmica da planta 
de maneira tão explícita como nos outros 
métodos citados. 
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FIGURA 6.28: (a) ação de controle m(k) 
do controlador em (6.44) com Kp = 10,5 
e (b) saída controlada, sendo que o traço 
contínuo é a saída da planta c(t) e os cír- 
culos são c(k). 


O código utilizado para gerar a Fi- 


gura 6.28 está a seguir. 


% modelo da planta na Eq. 6.14 
num=0.0484x[1 0.9667]; Y numerador 
den=conv([1 -1],[1 -0.9048]); Y denominador 
Gz=tf (num,den); ) função de transferência 


% compensador D(z) na Eq. 6.44 
numd=10.5+*[1 -0.88];Y numerador 

dend=[1 0.3];) denominador 

Dz=tf (numd,dend);/) função de transferência 


% função de transferência de malha 
OLz=series(Dz,Gz); 

% função de transferência de malha fechada 
CzRz=feedback(0Lz,1); 

% extrai o numerador 
Numd=CzRz.numi; 

4% extrai o denominador 
Dend=CzRz.denl; 

4% vetor de tempo discreto 

k=0:25; 

4% simulação da resposta ao degrau 
4% em malha fechada 
yd=dstep(Numd,Dend,length(k)); 


% simulação da planta contínua 
4% para fins de comparação 


% erro para referência um degrau unitário 
el=i-yd; 

% ação de controle discreta é a saída 

4% de D(z) quando a entrada é o erro 
m=dlsim(numd,dend,e1); 

% a entrada da planta é a saída do ZOH 

% cuja entrada é a saída de D(z) 
[t,uizoh]=zoh2(m,0.1,1); 

% saída contínua da planta 

% simulação contínua 

yc=lsim(0.1,[1 0.1 O0],ulzoh,t); 

4% faz os gráficos 

subplot (211); plot(k,m,?kx”,t,ulzoh,ºk?) 
title(?(a)?);; ylabel(?m(k)?); xlabel(ºk”) 


subplot (212); 

4% plota a saída discreta 

stem(k,yd,?k?) 

axis([k(1) k(end) min(yd)-0.1 max(yd)+0.2]) 
hold on 

4% plota a saída contínua nos mesmos eixos 
plot(t,yc); 

title(?(b)?); ylabel(º?c(k)?); xlabel(ºk?) 
hold off 


Gerar a saída da planta contínua é 


importante para saber o que se passa en- 
tre os intervalos de amostragem. O pro- 
jeto do controlador dead-beat mostra que 
é possível ter uma falsa impressão de que 
a planta esteja acompanhando a referên- 
cia de perto. Para realizar essa simu- 
lação (veja o código anterior) calcula-se 
a função de transferência de malha fe- 
chada e obtém-se a saída c(k) — variável 
yd no código — por simulação. Para cal- 
cular a ação de controle, determina-se o 
erro como a diferença entre o degrau uni- 
tário da referência e a saída da malha. 
Esse erro é usado como entrada para a 
função de transferência do compensador 
para obter a ação de controle m(k) — va- 
riável m no código. Usa-se a função zoh2 
para obter o equivalente à entrada “con- 
tínua” da planta — variável ulzoh no có- 
digo. Por simulação da planta contínua, 


G(s), com entrada ulzoh é possível ver o 
comportamento de G(s) entre os instan- 
tes de amostragem. 


6.6.3 O método de Kalman 


A exigência feita pelo método descrito nesta 
seção é menor do que aquela do método de 
projeto do controlador dead-beat. O método 
foi originalmente proposto por Kalman e, as- 
sim, leva seu nome. O método é de fácil exe- 
cução. O controlador projetado requer o co- 
nhecimento somente de dois polinômios em 
2 1, indicados a seguir: 
C(z 


TO Shodiio ha and (6.63) 


Ro =qo+qn2!+qoz +....(6.64) 


O primeiro passo do método é ajustar a 
função de transferência de pulsos G(z) para 
obter G(z) tal que a soma dos coeficientes 
do numerador de G(z) seja igual a 1. Feito 
esse ajuste tanto nos coeficientes do nume- 
rado como do denominador, obtém-se G(z), 
que é dinamicamente igual a G(z). Portanto, 
pode-se escrever: 


C(z) n C(z) R(z) o“ T(z) 
M(z) R()M(:) Q(2) 


G(z) = (6.65) 
em que C(z) e M(z) são, respectivamente, as 
transformadas Z da saída controlada da ma- 
lha e a ação de controle; T(z) e Q(z) foram 
definidos em (6.63) e (6.64). 

Por fim, usando o resultado (6.65) em 
(6.50) chega-se à expressão do controlador: 


o T(z) - Qz) T(2) 
o = aoi-TO TOI-TO 
Q(2) 


TO (6.66) 


sendo que T'(z) e Q(z) devem estar expressos 
na forma de polinômios em 2”! como indi- 
cado em (6.63) e (6.64). 

Assim, basta encontrar Q(z) e T(z) para 
obter o controlador D(z). Os polinômios Q(z) 
e T(z), por sua vez, são obtidos por equiva- 
lência com o denominador e numerador de 

Um lado negativo deste método, assim 
como no caso do método de dead-beat, é a 
falta de parâmetros de sintonia. Uma vez de 
posse da função de transferência de pulsos, 
cada um desses métodos — com base nas pró- 
prias premissas — fornece o controlador dire- 
tamente. O próximo exemplo ilustra como a 
aplicação do método visto nesta seção é sim- 
ples. 


Exemplo 6.6.3 


Voltamos a considerar a função de trans- 


ferência de pulsos do Exemplo 6.6.1: 


0,0484(2 + 0,9667) 

(z — 1)(z — 0,9048) 
0,0484271 + 0,0467922 

1 — 1,9049271! + 0,904827-2' 


Ca — 


Como a soma dos coeficientes do nume- 
rador é igual a 0,09519, dividimos os co- 
eficientes tanto do numerador como do 
denominador por esse número para ob- 
ter 


0,5084271 + 0,4915272 T(z) 


Élz = 
(2) 10,5053 — 20,01162-1 + 9,50522-2 Q(z) 


Portanto o controlador é dado por 


D(d= 10,5053 — 20,011627! + 9,5052272 
1— 0,5508421 — 0,49152-2 

- 10,505322-20,01162+9,5052 
E — 0,5084z— 0,4915 


(6.67) 


O desempenho do controlador (6.67) 
está mostrado na Figura 6.29. 
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FIGURA 6.29: (a) ação de controle m(k) 
do controlador em (6.67) projetado pelo 
método de Kalman e (b) saída contro- 
lada, sendo que o traço contínuo é a saída 
da planta c(t) e os círculos são c(k). 


Uma razão para o bom desempenho 
do método neste exemplo é que a fun- 
ção de transferência de pulsos tem pre- 
cisamente o mesmo formato especificado 
pelo método. 


Todos os métodos de projeto utilizados 
neste capítulo iniciaram com o model da 
planta. Os resultados de desempenho foram 
obtidos fechando-se a malha no mesmo mo- 
delo da planta utilizado para o projeto. Isso é 
certamente não muito realista, uma vez que 
na prática o controlador deve apresentar o 
desempenho desejado na planta, não no mo- 
delo. O quanto imperfeições no modelo uti- 
lizado no projeto eventualmente podem afe- 
tar o desempenho do controlador quando co- 
locado em malha fechada com a planta é 
uma importante questão de robustez. O pró- 
ximo exemplo ilustra um aspecto relativa- 
mente simples da robustez de alguns dos con- 


troladores projetados neste capítulo. 


Exemplo 6.6.4 


Aqui consideramos alguns dos controla- 
dores projetados ao longo do capítulo uti- 
lizando o modelo nominal da planta (ver 
Eq. 6.14): 


0,0484(z + 0,9667) 


SO = = DICE IO 


Uma diferença importante no pre- 
sente exemplo é que ao verificar o desem- 
penho da malha fechada usamos modelos 
perturbados. O desajuste entre o modelo 
nominal e o modelo perturbado objetiva 
reproduzir em simulação a diferença que 
há entre um modelo e a planta física. Por 
questões de simplicidade, aqui somente 
assumimos que as perturbações atuam 


em alguns parâmetros. Assim, as malhas 
fechadas são simuladas usando modelos 
com a seguinte aparência: 


— 0,0484,(2+0,9667€5) 
— (2-1(z-0,9048€3) 


Ga(z) (6.68) 


em que e; — U(1,0,05º), i=1,2,3 são va- 
riáveis aleatórias com média unitária e 
variância o2=0,025. A Figura 6.30 mos- 
tra cinquenta realizações de respostas ao 
degrau das funções de transferência de 
malha fechada 

C(z) D(2)Ga(z) 


O) — Reco 


em que D(z) é um dos quatro controlado- 
res em (6.44) com (6.45), (6.55), (6.62) e 


(6.67). Para cada uma das cinquenta re- 
alizações de Ga(z) foram calculadas as 
respectivas respostas em malha fechada. 


FIGURA 6.30: Respostas ao degrau uni- 
tário de (6.69) para os seguintes con- 
troladores D(z) (a) (6.55), (b) (6.62), 
(c) (6.67) e (d) (6.44) com (6.45). Para 
a visualização, os valores de c(k) foram 
ligados por linhas contínuas. 


Dessa figura é possível ver o método 
menos robusto é o projeto por dead-beat 


o que era esperado uma vez que é o pro- 
jeto mais exigente. O método de Dahlin 
é mais robusto que o de dead-beat, mas 
certamente menos robusto que o método 
de Kalman e o projeto pelo lugar das 
raízes. Note que os controladores dead- 
beat e de Dahlin são aqueles que expli- 
citamente usam a inversa da função de 
transferência nominal. Parte da robustez 
do controlador projetado pelo método de 
Kalman advém de usarmos um modelo 
com a estrutura prevista pelo método. 
Deve ser notado que os demais métodos 
de projeto não pressupõem qualquer for- 
mato específico para a função de transfe- 
rência de pulsos. 

É interessante investigar a robustez 
também para perturbações estruturais e 
não apenas paramétricas, como realiza- 
das neste exemplo. Para isso Ga(z) deve 
ser escolhida com uma estrutura diferente 


daquela da planta. Por fim, deve ser no- 
tado que as perturbação introduzidas nos 
parâmetros são bastante pequenas. O 
fato de não termos perturbado o polo em 
z = 1 é que de modo geral esse é um polo 
de posição bem conhecida. 


Nota Histórica 


Em um interessante artigo sobre métodos di- 
retos de projeto de controladores digitais, 
após indicarem que o interesse pela análise 
de sistemas amostrados era motivado dentre 
outros por sistemas como os radares, os au- 
tores escreveram: “mais recentemente, o uso 
de computadores digitais — que são essencial- 
mente dispositivos amostrados — em conjunto 
com controle de processos tem demandado o 
estudo de formas para tirar proveito de sua 
capacidade computacional com o propósito 


de estabilizar e ajustar sistemas de controle” 
(Bergen e Ragazzini, 1954, p. 236). 


Nesse artigo os autores discutem aspectos 
a serem levados em conta na escolha do mo- 
delo de referência em métodos de síntese di- 
reta de controladores digitais (ver Seção 6.6). 
A grande surpresa desse artigo é que, ao f- 
nal, entre as discussões aparece um texto de 
uma página de Rudolf Kalman com o método 
apresentado na Seção 6.6.3. Kalman introdu- 
ziu o assunto nos seguintes termos: “Gostaria 
de delinear um método alternativo para de- 
terminar o filtro compensador em tempo dis- 
creto D*(2) quando a planta H(s) e a forma 
desejada para o transiente são fornecidos. O 
método, de maneira assombrosamente sim- 
ples, permite realizar o projeto diretamente 
a partir das propriedades de H(s)” (Kalman, 
1954, p. 245). 


Um aspecto interessante da discussão le- 
vantada por Kalman é que o método tem mo- 


tivação física no uso de relés para implemen- 
tar a ação de controle que praticamente se 
limita a aplicar um pulso positivo seguido de 
um negativo (ver Figura 6.29a). O segundo 
aspecto importante apontado por Kalman é 
que o tempo de amostragem T' deve ser es- 
colhido de maneira a garantir que a ação de 
controle não exceda o que pode ser imple- 
mentado na planta. À medida que T é redu- 
zido, a ação de controle necessária para que o 
erro seja zero a partir de t = 2T é maior. Na 
réplica aos comentários de Kalman, os auto- 
res indicam que o controlador, que é unica- 
mente determinado uma vez fixada a função 
de transferência de pulsos, pode não ser im- 
plementável e que o método não tem parâ- 
metros de sintonia que permitam flexibilizar 
o projeto, a não ser a escolha de 7. 


Leitura Recomendada 


Discussões sobre características de sistemas 
de controle projetados no domínio de frequên- 
cia e limitações de projeto podem ser encon- 
tradas em (Franklin et al., 2013; Cruz, 2022). 
Apesar de as análises realizadas nesses livros 
terem como foco sistemas em tempo contí- 
nuo, os principais fundamentos de controle, 
bem como suas limitações são compartilha- 
dos por sistemas amostrados. O Prof. Jaime 
Cruz em seu livro enfatiza os aspectos per- 
tinentes à robustez dos sistemas de controle 
projetados. O projeto pelo método do lugar 
das raízes é abordado em vários livros, tais 
como (Phillips e Troy Nagle, 1995; Franklin 
et al., 1998). Nem todo livro de controle di- 
gital aborda métodos de síntese direta, uma 
exceção é a referência (Leigh, 2006). Uma re- 
ferência que trata de vários aspectos do pro- 
jeto, inclusive implementação de sistemas de 


controle em tempo discreto é o livro (Landau 
e Zito, 2020). 


Exercícios 


Em alguns itens abaixo é necessário fazer 
o projeto de um controlador. Para realizar 
o projeto, use uma função de transferência 
que descreva o comportamento do processo 
em torno do ponto de operação de interesse. 
Tendo projetado o controlador, feche a malha 
usando o script simrk ph CD. Ou seja, para 
validar resultados por simulação, escreva o 
controlador projetado na forma de uma equa- 
ção de diferenças e implemente-a no script 
indicado. Assim, pede-se: 


1. usando o controlador puramente pro- 
porcional K=1/5, determine de ma- 
neira teórica e por simulação o erro 
em estado estacionário para entrada em 


degrau. Para a abordagem teórica, use 
uma função do processo à sua escolha. 
Para verificar o resultado simulado, use 
simrk ph CD; 


igual ao item anterior, mas para distúr- 
bio em degrau; 


para o mesmo controlador usado nos 
itens acima, estime de maneira teórica 
e por simulação, o tempo de acomo- 
dação ts. Discuta o procedimento se- 
guido; 


variando o valor de K, qual é o menor ts, 
que consegue atingir sem exceder 20% 
de sobressinal? 


projete um compensador de avanço de 
fase para reduzir o tempo de acomo- 
dação para a metade. Qual foi o im- 
pacto sobre o erro em estado estaci- 
onário para entradas em degrau? Se 


a meta não foi alcançada, discuta as 
possíveis razões para isso. Usando o 
script simrk ph CD, mostre o compor- 
tamento em malha fechada com o con- 
trolador projetado; 


. projete um compensador de atraso de 
fase para reduzir o erro em estado esta- 
cionário para entradas em degrau para 
a metade. Qual foi o impacto sobre ts 
e Mp? Se a meta não foi alcançada, 
discuta as possíveis razões para isso. 
Usando o script simrk ph CD, mostre o 
comportamento em malha fechada com 
o controlador projetado; 


. sintonize um controlador PID para 
1) eliminar o erro em estado estacio- 
nário para entradas em degrau, ii) al- 
cançar a metade do tempo de acomo- 
dação do caso em que o controlador é 
K=1/5, iii) não exceder 15% de sobres- 


AO: 


sinal. Usando o script simrk ph CD, 
mostre o comportamento em malha fe- 
chada com o controlador projetado; 


. projete e implemente um controla- 


dor dead-beat. Usando o script 
simrk ph CD, mostre o comporta- 
mento em malha fechada com o con- 
trolador projetado; 


. projete e implemente um controlador 


de Dahlin para alcançar a metade do 
tempo de acomodação do caso em que 
o controlador é K=1/5. Usando o 
script simrk ph CD, mostre o compor- 
tamento em malha fechada com o con- 
trolador projetado; 


projete e implemente um controlador 
pelo método de Kalman. Usando o 
script simrk ph CD, mostre o compor- 
tamento em malha fechada com o con- 
trolador projetado; 


11. discuta os principais aspectos, prós e 
contras, e desempenho dos controlado- 
res projetados. 


6.1. Faça o gráfico de D(e!)G(e!º) com com 
Kp = 1 usando as funções de transferência 
do Exemplo 6.1.3 na carta de Nichols, e en- 
contre de quanto essa curva deve subir de 


maneira à coincidir aproximadamente com o 
círculo de raio M de 0dB. 


6.2. Seja o sistema mostrado na Figura 6.1 
com Di) = dis p= 16 


o =s0 +58 K 
s( 


G(s) = - | (6.70) 


S 


Determine o erro em estado estacionário para 
entrada em degrau e para entrada em rampa. 


6.3. Verifique computacionalmente por meio 
de exemplos a validade de (6.33). 


6.4. Derive a expressão (6.57). 


6.5. Mostre que o controlador de Dahlin tem 
poloem z=1paran=0en=l1. 


6.6. Seja o sistema amostrado de controle 
apresentado na Figura 6.31. Estime as mar- 
gens de fase e de ganho para o sistema não 
compensado, ou seja, para D(z) = 1. Simule 
o sistema não compensado em malha fechada 
e determine o sobressinal máximo, o tempo 
de subida e o tempo de acomodação. 
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FigurA 6.31: Diagrama de blocos do sis- 
tema em malha fechada considerado no Exer- 
cício 6.6. 


Projete o controlador mais simples que 
consiga (comece considerando D(z) = K) 
para alcançar as seguintes especificações para 
o sistema controlado: sobressinal máximo de 
10%, tempo de subida máximo de 2s, mar- 
gem de ganho maior que 10 dB. 

Mostre o controlador projetado e verifi- 
que que as especificações tenham sido alcan- 
çadas. Além disso, determine a margem de 
fase e o tempo de acomodação. 


6.7. No Exemplo 6.4.1 foram projetados re- 
guladores que, em malha fechada, não apre- 
sentam erro em estado estacionário para mu- 
danças em degrau da referência, mas não re- 
jeitam distúrbios em degrau. Lembre-se que 
rejeitar distúrbio significa a eliminação do 
efeito do distúrbio em estado estacionário. 
Explique a razão disso. 


6.8. No Exemplo 6.4.1 o compensador (6.43) 
foi simulado com Kp = 10,5, sendo que o 


projeto para atender a condição de K, > 1 
requer Kp = 10,8. Usando resultados de 
simulações numéricas, discuta como peque- 
nas mudanças em Kp afetam: 1) o sobressi- 
nal máximo, ii) o erro em estado estacionário 
para entrada em rampa e jii) a máxima am- 
plitude da ação de controle, que é a saída do 
compensador. 


6.9. Use relações apresentadas na Seção 6.3 
para confirmar, ainda que de forma aproxi- 
mada, os valores de ts e t, apresentados no 
Exemplo 6.5.2. 

6.10. Ajuste um compensador dinâmico para 
o sistema discutido no Exemplo 6.5.2 a fim 
de aumentar a banda passante do sistema em 
malha fechada. 

6.11. Projete o compensador dead-beat para 
um sistema amostrado que tenha a seguinte 
função de transferência de pulsos: 

E et 

200 (1=2-12 


G(z) 


e forneça a equação de diferenças que deve 
ser implementada em software para realizar 
o controle. O controlador resultante tem um 
polo que produz oscilações em z = —1 (rin- 
ging pole)? 


6.12. Projete o compensador pelo método 
de Kalman para os sistemas amostrados que 
tenham as seguintes funções de transferência 
de pulsos: 


0,5 + 0,227 

a Sta (2— Dl -02)' 
AB4 

Dq) - 08 (2 + 0,9667) 


(z — 0,8)(z — 0,90). 


Em cada caso, mostre a ação de controle, a 
saída em tempo contínuo e discreto da res- 
pectiva malha. Comente as principais dife- 
renças observadas. 


Parte Il 


Representação no 
Espaço de Estados 


Capítulo 7 


O Espaço de 
Estados 


Neste capítulo apresentaremos o conceito de 
espaço de estados. Veremos que um sistema 
dinâmico pode ser representado nesse espaço 
e que tal representação é mais geral que a 
que temos usado até este ponto. Duas van- 
tagens na representação de sistemas dinâmi- 


cos no espaço de estados são: tal represen- 
tação é mais adequada para lidar com siste- 
mas multivariáveis, e é possível representar 
sistemas não lineares em espaço de estados. 
Ainda que seja possível representar sistemas 
lineares multivariáveis utilizando métodos de 
transformadas — nesse caso são usadas ma- 
trizes de transferência —, tal representação 
se torna bastante morosa no caso de o sis- 
tema ter mais de duas entradas e/ou saídas. 
Quanto a sistemas não lineares, as técnicas 
baseadas em transformadas não são adequa- 
das. Portanto, familiarizar-se com a repre- 
sentação em espaço de estados é de grande 
importância. 

Para motivar a discussão, considere a 
equação de diferenças 


ylk) = —y(k—-D+u(k)—u(k—1), (7.1) 


cujo diagrama de simulação é mostrado na 
Figura 7.1. 


FIGURA 7.1: Diagrama de simulação corres- 
pondente à Eq. 7.1. O operador de atraso q | 
é tal que y(k — 1) = q ty(k). 


A ordem dinâmica de uma equação de di- 
ferenças é dada pelo maior atraso na variá- 
vel de saída. No caso da Eqg. 7.1 a saída é y 
e o maior atraso dessa variável é 1. Em ou- 
tras palavras, a Eq. 7.1 corresponde a um sis- 
tema de primeira ordem, como pode ser visto 
aplicando a transformada Z a essa equação 
e considerando as condições iniciais nulas: 


Y()+z M=U(o[t-2] 
Kia) 1-2 2a 
U(z) 11h21 241º 


(7.2) 


Apesar de ser um sistema de primeira or- 


dem, o diagrama de simulação da Figura 7.1 
utiliza dois blocos de atraso indicados por q * 
e que correspondem a duas posições de me- 
mória. Como se trata de um sistema de pri- 
meira ordem, é natural inquirir se é possível 
representá-lo por um diagrama de simulação 
com apenas um bloco q !. A resposta a essa 
questão é afirmativa e o diagrama é mostrado 
na Figura 7.2. 


FIGURA 7.2: Diagrama de simulação simpli- 
ficado correspondente à Eg. 7.1. 


Para constatar a equivalência do ponto de 
vista de entrada-saída entre as duas represen- 
tações, basta comparar as funções de trans- 
ferência que elas implementam. Apliquemos 
a transformada Z aos sinais no sistema da 


Figura 7.2 e consideremos condições iniciais 
nulas: 
Y()=X(9)-X(2)z! = X(o)[1-2"H. 


Isolando X(z) na primeira equação e substi- 
tuindo o resultado na segunda, resulta em: 


ve Ce praça 


1+27 
AC DD da 
EN E, 


que é idêntica a (7.2). Portanto, apesar de os 
sistemas das figuras Figura 7.1 e Figura 7.2 
serem diferentes, a função de transferência 
da entrada para a saída em ambos é igual. 
Um ponto interessante do diagrama de simu- 
lação mostrado na Figura 7.2 é que o ope- 
rador de atraso não atua sobre os sinais de 
entrada e saída, como é o caso no diagrama 


da Figura 7.1, mas o faz sobre uma variável 
interna ao sistema, x(k). 


Antes de prosseguir, devemos observar 
que os diagramas nas figuras 7.1 e 7.2 não 
são diagramas de blocos, mas são diagramas 
de simulação. Em tais diagramas, os blocos 
representam operadores. Em tempo discreto 
normalmente usa-se o operador de atraso q ! 
e em tempo contínuo o operador de integra- 
ção. No caso de diagramas de blocos, os 
blocos normalmente representam funções de 
transferência. A origem dos diagramas de 
simulação remonta aos computadores analó- 
gicos, em tempo contínuo. Um diagrama de 
simulação em tempo contínuo era usado pra- 
ticamente como um “código” em computação 
analógica. No caso discreto, como pode ser 
constatado pela Eq. 7.1 e pela Figura 7.1, 
o diagrama de simulação representa equa- 
ções de diferença que podem ser rapidamente 
implementadas usando alguma linguagem de 


programação. 


O diagrama da Figura 7.2 usa uma variá- 
vel interna, chamada variável de estado e, ao 
contrário das equações (7.2) e (7.3), é uma re- 
presentação no domínio do tempo. De fato, 
a representação em espaço de estados, seja 
para sistemas de tempo contínuo ou discreto, 
é definida no domínio do tempo, ao contrá- 
rio da representação que utiliza funções de 
transferência, que é definida no domínio das 
transformadas: domínio s para o caso contí- 
nuo e domínio z para o caso discreto. 


Na representação em espaço de estados, 
o estado do sistema é representado pelo ve- 
tor de estado a(k) E IR”. Geometricamente, 
a(k) corresponde a um ponto no espaço Eu- 
clidiano (trataremos apenas do caso linear) 
de dimensão n no instante k. À medida que 
k aumenta, esse ponto pode mover-se no es- 
paço, representando uma mudança no estado 
do sistema que, no instante k, é unicamente 


determinado por x (k). O comportamento do 
sistema ao longo de um intervalo k; < k < kr 
é determinado pela sequência de valores de 
a(k), k = ki, ki; + 1,... kg, como ilustrado na 
Figura 7.3. 


FIGURA 7.3: Representação de espaço de es- 
tado tridimensional contendo parte de uma 
trajetória, que começaem x(k;) e termina em 


Dizer que o estado do sistema no instante 
k é unicamente determinado por x(k) signi- 


fica que a(k) e as entradas que atuam sobre 
o sistema (se houver) no instante k definem 
o próximo estado do sistema, a(k +1). Além 
disso, se a(k) € IR” o menor número de va- 
riáveis necessárias para determinar o estado 
do sistema é n. Em outras palavras, a(k) 
é composto pelo menor número de variáveis 
necessárias para determinar unicamente o es- 
tado do sistema. As variáveis de estado não 
são únicas, mas a dimensão de a(k) é o me- 
nor número de variáveis necessárias para des- 
crever o sistema em um determinado instante 
k. Essa importante representação de siste- 
mas dinâmicos, chamada representação em 
espaço de estados, é apresentada no presente 
capítulo. 


7.1 A Representação em 
Espaço de Estados 


À representação em espaço de estados de um 
sistema em tempo discreto não linear pode 
ser escrita como 


a(k+1) = flae(k), u(k)] 
ylk) = hle(k),u(k)), (7.4) 


em que x € IR” é o vetor de variáveis de 
estado ou simplesmente o vetor de estado, 
u E IR" é o vetor de entradas e y E RP é 
o vetor de saídas. Para o caso monovariável, 
r=p=1. 


À primeira equação de (7.4) é a equação 


dinâmica e corresponde a um conjunto de mn 
equações de diferença. A segunda equação 
em (7.4) é a equação de saída, que é composta 
de p equações algébricas. Toda a descrição 
da dinâmica do sistema é realizada pela pri- 
meira equação de (7.4), que descreve como a 
entrada u(k) e o estado x(k) atuais determi- 
nam o estado no próximo instante a(k + 1). 
A segunda equação em (7.4) descreve a saída 
como uma função do vetor de estados e, em 
alguns casos, da entrada. Para o caso linear 
variante no tempo, a representação em es- 
paço de estados toma a seguinte forma: 


e(b+1)= A(kJe(k)+B(k)u(k) 
y(k) = (Jak) +D(Ku(k), (1.5) 


em que A(k) E IR"*”", B(k) E IR"*”, C(k) € 
R?*” e D(k) e IR?*” são matrizes que va- 
riam com o “tempo discreto”. No caso de o 
sistema ser invariante no tempo, tais matri- 
zes são constantes e a representação em es- 


paço de estados torna-se: 


a(k + 1) = Ax(k) + Bu(k) 
y(k)=Ca(k) + Du(k), (7.6) 


que é a maneira comumente utilizada no res- 
tante deste livro. No caso de uma entrada e 
uma saída (r = 1, p = 1) são usados os veto- 
res be c" em vez de Be C, respectivamente. 
Portanto, a Eg. 7.6 revela que, na represen- 
tação em espaço de estados, o estado futuro, 
a(k + 1), e o vetor de saída atual, y(k), são 
obtidos por combinações lineares do estado e 
do vetor de entrada atuais. 

A representação em espaço de estados não 
é única, ou seja, um mesmo sistema pode ser 
representado por vetores de estado distintos, 
o que resulta em um diferente conjunto de 
matrizes (4,B,C,D). É importante notar 
que o que muda é a representação, mas o 
sistema e os sinais de entrada e saída são 
os mesmos, como ilustrado na Figura 7.4. 


A mudança de representação corresponde à 
mudança do conjunto de coordenadas, como 
ilustrado na Figura 7.5. Algumas represen- 
tações, chamadas canônicas, são particular- 
mente úteis. 


(a) (b) 


uk) (4,B,C,D) uk) u(k) (4,6,6,D) E) 
xeER" zeR" 


FIGURA 7.4: Diferentes representações em 
espaço de estados do mesmo sistema. Em 
(a) o vetor de estado é x, em (b) é £. 


(a) (b) 


FIGURA 7.5: As representações em espaço 
de estado em (a) e (b) são equivalentes, se a 
matriz de transformação P E IR”*” for não 
singular. 


Exemplo 7.1.1 


Neste exemplo desejamos representar a 
equação de diferença (3.18) na forma de 
uma equação de estado. Por comodi- 
dade, reproduzimos a equação de dife- 
rença a seguir substituindo a variável 


m(k) por y(k). 

u(k) = 12y(k-1)-0,2y(k—2)+10u(k—1) 
+5u(k —2) 
y(k+2) = 12y(k+1)—0,2y(k) +10u(k-+1) 
+5u(k). (7.7) 


Escolhendo os estados como x1(k) = y(k) 
e xo(k) = y(k + 1), à equação de diferen- 
ças em (7.7) pode ser escrita como 


gi (k+2) = ga(k+1D)=1,2x5(k)—0,271(k) + 
+1Ou(k+1)+5u(k). 


Portanto, a representação em espaço 


de estados pode ser escrita como 


at) = [ão a ][a8 + 
+[ : O | e | 
v6) = no| Sl]. (7.8) 


À representação em (7.8) é un tanto 
quanto desajeitada, pois a entrada apa- 
rece como dois sinais u(k) e u(k + 1). 
Na Seção 7.2 é visto como representar a 
equação de diferença em (7.7) de maneira 
mais elegante. 


7.1.1 Transformação de 
Similaridade 
Considere uma matriz não singular P E IR”*” 
tal que 
lh) = Ph): (7.9) 
A matriz P relaciona o vetor de estado x 
a um outro vetor de estado % (ver Exercí- 
cio 7.2). Substituindo (7.9) em (7.6) tem-se 
Pá(k+1) = AP&(k)+Bu(k) 
y(k)=CPx(k)+Du(k), (7.10) 


e como, por hipótese, P é não singular, chega- 
se a 


x(k+1) = PI AP&(k)+P Bu(k) 


y(k)=CPx(k)+Du(k), (7.11) 
ou ainda 
x(k + 1) = Ax(k) + Bulk) 
y(k)=C&x(k) + Du(k), (712) 


Em palavras, a matriz P define uma 
transformação de similaridade, de modo que 
o sistema (4, B,C, D) passa a ser represen- 
tado como (À, B,€, D), como ilustrado na 
Figura 7.4. À transformação de similaridade 
transforma o estado do sistema de um con- 
junto de coordenadas para outro. O sistema 
em si não sofre transformação, mas somente 
as coordenadas em que está representado. 
Portanto, a representação do sistema muda, 
mas não suas propriedades intrínsecas, tais 
como a função de transferência e a equação 
característica. 


Exemplo 7.1.2 


Seja o sistema 


[2620] = [ão va] [2] +82] 


A fim de ilustrar os detalhes das ope- 
rações matriciais, escolheremos uma ma- 
triz de transformação diagonal — nesse 
caso a inversa é obtida invertendo-se cada 
elemento da diagonal: 


P= [os] =D sa) 


Portanto, as matrizes da representa- 
ção em espaço de estados nas novas co- 
ordenadas são: 


A= [8 aee | 


2 

0 
“Tiro o es jo A PE 
no o ia =04 85 |5| =215 d2 | 


GS? 
] 
[| 
E 
(e se 
bo 
p= 
Es) 
Cc 
, ie | 
Liss! 
Ho 
LI, 
] 
[is | 
pe 
ES 1) 
Cc 
| E | 


em que usamos b e c” pelo fato de o sis- 
tema ser monovariável. A Figura 7.6b 
mostra a resposta ao impulso das duas 


representações que, como esperado, coin- 
cidem. Contudo, é possível ver pela Fi- 
gura 7.6a que o comportamento dos es- 
tados (variáveis internas) é diferente. 


o 9 e e e E) & e 
A 1! o E 7] 
(e) 
Ee) 
g v v vy v v v v 
g 0.5 A X A A A A A A A ] 
0 hd Y J 
0 2 4 6 8 10 
amostras 
(b) 
EO á o e) º [o [o º [o | 
15+ 1 
[2] 
q 
o 1o a J 
q 
[2] 
5+ d 
or o A 
0 2 4 6 8 10 


amostras 


FIGURA 7.6: Resposta ao impulso a par- 
tir de condições iniciais nulas para as 
duas representações: (a) estados (É) 11, 
(0) 22; (V) Z%1, (A) Za; (b) saídas (DI) y, 
(0) y. As saídas, estão superpostas. 


Os principais comandos usados para 
gerar os resultados da Figura 7.6 estão 
mostrados abaixo: 


4% matrizes originais 
A=[0 1;-0.2 1.2]; b=[0;1]; c=[5 10]; d=0; 


% gera sistema discreto com 
% as matrizes originais 
Sys=ss(A,b,c,d,-1); 


P=[2 0;0 3]; Y matriz de similaridade 

% novas matrizes 

At=inv(P)+*A*P; bt=inv(P)xb; ct=cx*P; dt=0; 

4% gera sistema discreto com as novas matrizes 
Syst=ss(At,bt,ct,dt,-1); 


% simulação da resposta ao impulso 
[y,t,x]=impulse(Sys); ) representação original 
4% representação transformada 
[yt,tt,xt]=impulse(Syst); 


O -1 utilizado no comando ss é para 
indicar que as matrizes fornecidas cor- 
respondem a um sistema em tempo dis- 
creto. Como pode ser visto na Figura 7.6, 
apesar de os estados serem diferentes em 
cada representação — pois a = Px e P 
não é identidade —, a entrada (impulso 
unitário) eas saídas, y= cClx ey = €'&, 


são idênticas. A igualdade das saídas 
pode ser comprovada matematicamente 
fazendo: y=€C p= ec PPJjp =. Pi 
sicamente, tanto a entrada como a saída 
são os mesmos sinais para ambas as re- 
presentações, pois o sistema é o mesmo 
(ver Figura 7.4). 


7.1.2 Equação característica 


Considere a expressão 
Av = dv, (7.14) 


em que A € Rº*”, v € 0” é um vetor não 
nulo e À € € é um escalar, possivelmente 
complexo. A partir de (7.14) pode-se escre- 
ver 


0= (AM — Ao. (7.15) 


Para que a expressão (7.15) tenha solução 
não trivial, deve-se ter v 0. Nesse caso é 
necessário que |(AI — 4)| = 0, em que |- | in- 
dica o determinante e 7 € IR”*” é uma matriz 
identidade. Os valores de À; 1 = 1,2,...n 
tais que (7.15) é atendida são os autovalores 
da matriz A e os respectivos v;,1=1,2,...n 
são os autovetores dessa matriz. 


O polinômio característico de A, que é um 
polinômio de grau n e mônico (o coeficiente 
de" é1),6 A(A) = |(AI— 4)]. Cada raíz de 
A(A) = 0 é um autovalor de 4. A equação 
característica da matriz A é: 


==: (7.16) 


Portanto, se A;, à = 1,2,...,n forem os au- 
tovalores de 4, então 


Dr Ap Si ie AO A) 


Um aspecto curioso da equação caracte- 
rística é que ela é satisfeita tanto por autova- 
lores da matriz 4, como pela própria matriz 
A. Para ver isso, seja A, um autovalor de A. 
Substituindo esse valor em (7.17) vemos que 
o primeiro termo do produtório, (A—Ai), se 
anula para À = Ay, portanto, A(A,)=0. De 
maneira semelhante, se À = A em |AJ-A| = 
OT, em que 1 é a matriz identidade com di- 
mensão igual à da matriz 4, vemos que essa 
relação é trivialmente verificada, como ilus- 
trado no próximo exemplo. O polinômio mi- 
nimo Y(A) é o polinômio mônico de menor 
grau que é satisfeito pela respectiva matriz 
A, ou seja W(A) = 07. O grau de V(A) é 


menor ou igual ao de A(A). Os autovalores 


de A anulam ambos os polinômios. No caso 
de autovalores distintos, esses polinômios são 
idênticos entre si (Chen, 1999, Cap. 3). 


Exemplo 7.1.3 


Seja o sistema 


[en] = [02 12] [o] +i]uo 


6) = [5 —25] [ao |. 


O polinômio característico da matriz A 
do sistema é (ver Eq. 7.17): 


sea fa | a 6] 


= A = 
“o N=ie 


= )2-1,2A+0,2, 


que tem raízes em À = 1e A = 0,2. 
Os autovalores de A são, por definição, 


as raízes da equação característica, por- 
tanto À = 1 e À = 0,2 são os autova- 
lores da matriz 4, o que pode ser verifi- 
cado usando o comando eig(A) do Ma- 
tlab. Substituindo A no polinômio carac- 
terísticos, temos: 


02 1,2 0 1 Ro 
Sis ES. a Pie feio to [+02 E ij = 


em que 1 é a matriz identidade de dimen- 
são dois. 


7.1.3 A matriz modal 


A expressão usada para definir autovalores e 
autovetores da matriz À é 


Av = Mu. (7.18) 


Reescrevendo (7.18) de maneira expan- 
dida para o caso em que os autovalores são 


reais e distintos, tem-se: 


[Avi Ava... Avn] = [Avi Agua... AnUn] 
[ A O... 0 | 
(0) AD o. 0 
Afvi v2...Vn] SR : so a à | 
0 O... An 
AM = MA 
A = MAM, (7.19) 


em que a matriz M E IR”*” é conhecida 
como matriz modal e é composta pelos au- 
tovetores da matriz A que formam um con- 
junto de n vetores linearmente independen- 
tes, o que implica que M é uma matriz não 
singular. Portanto, usando M como matriz 
de transformação, o sistema é representado 
em um sistema de coordenadas, definido pela 
matriz M, em que a matriz dinâmica é dia- 
gonal pelo fato de os autovalores serem dis- 
tintos. Como visto na Seção 7.2.3, a matriz 
diagonal À é utilizada na representação canô- 
nica de Jordan (veja a Eq. 7.40). 


Exemplo 7.1.4 


Neste exemplo deseja-se reescrever o sis- 
tema usado no Exemplo 7.1.2 usando a 
respectiva matriz modal. A partir de 
(7.18) escrevemos 


ns il vi e lr 
o poa a DR 


Para A, = 1, podemos escrever 


0 il vd o 
OR MD e RD 


o que resulta em vj = vz, portanto um 


autovetor tem a forma genérica 


acefi| 


Para Às = 0,2 tem-se 


Os Pai 5 a 
[o o) | ou: , 


o que resulta em v2 = 0,2vi ou 5v2 = vi. 
Assim um autovetor para esse autovalor 
tem a forma genérica 


aco [5) 


Por fim, uma matriz modal (para a = 


B=1)é 


M=food=|4 E 


Para realizar a inversão usamos: 


mai e MI = 1 mo2 a (7.20) 


M= = 
m21 maga det M |—-m21 mai 


portanto 


—1 1 —5 1/15 
= De paia 
sos e JrafE 5 


Usando a matriz modal, é fácil veri- 
ficar que as matrizes do sistema na nova 
representação são: 


que estão na forma canônica de Jordan 
(ver Exemplo 7.2.4). 


7.1.4 Invariância 


Sabemos que uma matriz A tem equação ca- 
racterística |AI — A| = 0. Se 4 for a matriz 


dinâmica de um sistema linear invariante no 
tempo com vetor de estado x(k), as raízes de 
AI — A| = 0, que são os autovalores de 4, 
caracterizam a respectiva resposta dinâmica. 
Se mudarmos as coordenadas em que se re- 
presenta esse sistema usando, por exemplo, 
ae(k) = Pã(k), ou seja &(k) = Prle(k), a 
nova matriz dinâmica é A = P-1AP. Dese- 
jamos obter a equação característica para Â 
e compará-la à equação característica de 4, 
para ver qual é o efeito da transformação de 
similaridade sobre tal equação. 


E 
ao: 


Portanto, começamos escrevendo a equa- 


ção característica de 4: 


AI-4| =0 
AI— P-'AP| = |P-'AP-P-tAP| =|Po!(AA)P|=0 
|PHAM-AP| = |AI— Al=0, (7.21) 


em que foi usado det(AB)=det(A)det(B) e 
IP|£0e |P!|Z0. O resultado em (7.21) 
mostra que a equação característica e, por- 
tanto, os autovalores da matriz são invarian- 
tes a transformações de similaridade. Em 
outras palavras, os autovalores das matrizes 
Ae À na Figura 7.4 são os mesmos, o que 
não é de estranhar, uma vez que se trata do 
mesmo sistema representado de forma dife- 
rente, sendo que uma representação pode ser 
obtida a partir da outra por meio de uma 
transformação de similaridade. 


Exemplo 7.1.5 


Seja a matriz 


; pis ro 
Ea | -2/15 1,2 | 


que, como derivado no Exemplo 7.1.2, é 
uma matriz “similar” à matriz A consi- 
derada no Exemplo 7.1.3. O polinômio 
característico de 4 é: 


a le | E no | 


1 
= 21 0h E = 1 2A40,2, 


que, como esperado, é igual ao de A (ver 
Exemplo 7.1.3). 


7.2 Formas Canônicas 


Na Subseção 7.1.1 vimos que é possível tomar 
uma representação em espaço de estados des- 
crita por (4, B,C, D) e reescrevê-la em um 
outro sistema de coordenadas, o que resulta 
em outro conjunto de matrizes (4, B,C, D). 
Essa mudança de coordenadas é realizada via 
uma matriz P € IR”*” não singular tal que 
av(k) = Pã(k). A utilidade de representar o 
sistema em outras coordenadas é que, ape- 
sar de equivalentes, algumas representações 
são mais práticas que outras para alcançar- 
mos certos fins. Em particular, as formas 
canônicas desempenham um importante pa- 
pel no estudo de sistemas em espaço de esta- 
dos. Esta seção apresenta algumas delas. 


7.2.1 Forma companheira 
controlável 


Nesta seção deseja-se encontrar uma repre- 
sentação em espaço de estados para uma fun- 
ção de transferência 


Do babaca 2 +. biz +bo 


Y(z 
(= a 
Ulz) 2” +anagz"I+...az+ao 


(7.22) 


Para este fim, reescrevemos (7.22) como 


Y(2) - (bacaznol + boca" 2 +... biz + bo) E(2) (7.23) 
U(z) (MM tan +...aztagE(z) COS 


em que E(z) = Z(e(k)), e a partir de (7.23) 
podemos escrever 


Y(z) = (ba-12"71 +ba-oz"o? +... biz+ bo) E(z) 
U(2) = (Etanol +..aztao)E(Z), (7.24) 


que no domínio de tempo discreto se tornam, 
respectivamente: 


y(k) = brae(k+n—1)+bn-se(k+n—2)+...bre(k+1)+boe(k) 
u(k) = e(k+n)+an-1e(k+n—1)+.. .are(k+1) +age(k)(7.25) 


A seguir definimos o seguinte conjunto de va- 
riáveis de estado 


da = Eh) 
ro(k) = e(k+ gi(k + 1) 
k + 2) — xo(k +1 


mes t 2 Sel 


eb) E ai +n—-D=2(k+1) 
Yni(k) = e(k+n)= za(k+ 1), (7.26) 


em que = foi utilizado para indicar que a 
igualdade procede de uma escolha “arbitrá- 
ria”. Reescrevendo as expressões de u(k) e 
y(k) em (7.25) em termos das variáveis de 
estado definidas em (7.26), tem-se 


u(k) = tnsi(k) +an-caixn(k) +... .arxo(k) + aoxr(k) 
= in(k+HI) +ancign(k) +...arxo(k) + aoxi(k) 
y(k) = bai xn(k)+bn-owxn- (k)+...bixo(k)+boxa (k). 
(7.27) 


Por fim, reescrevendo as equações (7.26) e 
(7.27) em forma matricial chega-se, respecti- 


vamente, a: 


aa (k + 1) 0 1 0 0 a (k 
vo(k + 1) 0 0 1 0 vo(k 
Ln-1(k + 1) (0) (0) 0 1 tn-1(k) 
tn(k + 1) ao a as An-1 Yn(k 
0 
0 
+ |: | u(k 
0 
1 
ti (k) 
vo(k) 
ylk) = [bo bi ...bn-2 bao] : » (7.28) 
Ln-1(k) 
Tn(k) 


que está na forma de (7.6), com D = 0, para 
o caso de uma entrada e uma saída. É im- 
portante notar que os coeficientes a; e b; uti- 
lizados em (7.28) são os mesmos da função 
de transferência (7.22). Assim, dizemos que 
(7.28) é uma realização da função de transfe- 
rência (7.22), em particular (7.28) é chamada 


de forma companheira controlável, por ra- 
zões discutidas em breve. As décadas de 1950 
e 1960 foram fundamentais para o desenvolvi- 
mento da teoria de realizações. Usando essa 
teoria foram desenvolvidos métodos para im- 
plementar (realizar), a partir de uma função 
de transferência, um sistema físico na forma 
de circuitos elétricos, pneumáticos etc. 


O diagrama de fluxo de sinal correspon- 
dente à forma canônica companheira contro- 
lável (7.28) é mostrado na Figura 7.7. Tanto 
o diagrama de fluxo de sinal como as matrizes 
de estado podem ser obtidas, por inspeção, 
diretamente da função de transferência (7.22) 
uma vez que à forma companheira controlá- 
vel tiver sido escolhida como representação. 
Note que a entrada afeta todos os estados in- 
dependentemente dos valores dos parâmetros 
a; e b;. Isso justifica o adjetivo controlável 
(veja também o Exemplo 8.1.2). 


FIGURA 7.7: Diagrama de fluxo de sinal da 
forma companheira controlável. 


Na Seção 8.1 apresentaremos uma defini- 
ção formal de controlabilidade. Além disso, 
como visto ainda neste capítulo, os coeficien- 
tes a; que aparecem na matriz dinâmica (ma- 
triz 4) são os mesmos da respectiva equação 
característica. Portanto, diz-se que a matriz 
A é companheira da sua equação caracterís- 
tica. 


Exemplo 7.2.1 


Voltamos a considerar a equação de di- 
ferenças em (7.7) do Exemplo 7.1.1. A 
fim de utilizar a forma companheira em 
(7.28), primeiramente colocaremos a re- 
ferida equação de diferenças na forma de 
uma função de transferência. Portanto, 
tomando a transformada Z de (7.7) e 
considerando condições iniciais nulas che- 
gamos a: 
Vi) pao 


E 
U(z) 22-1,22+0,2' E) 


que tem polos em z = 1 ez = 0,2 e um 
zero em z = —0,5. Substituindo os coefi- 
cientes de (7.29) diretamente em (7.28), 
chegamos a: 


ES RI RE 
ulk) = [5 10] [ ds |. (7.30) 


em que, ao contrário de (7.8), somente 
u(k) é utilizado. Portanto, (7.30) é a re- 
presentação em forma companheira con- 
trolável da equação de diferenças em (7.7) 
e da função de transferência em em (7.29). 


Uma representação no domínio de tempo 
discreto e, portanto, mais próxima à repre- 
sentação no espaço de estados, equivalente 
ao diagrama de fluxo de sinal, é o diagrama 
de simulação, mostrado na Figura 7.8. 


FiGUuRA 7.8: Diagrama de simulação da 
forma canônica companheira controlável, 
correspondente ao diagrama da Figura 7.7. 


Uma regra que se aplica aos dois tipos de 
diagramas é que as variáveis de estado apa- 
recem nos nós que seguem ramos com ganho 
2 1 no diagrama de fluxo de sinal. Semelhan- 
temente, as variáveis de estado são as saídas 


dos blocos com o operador de atraso q !, no 


diagrama de simulação. 


Uma maneira alternativa da forma com- 
panheira controlável é 


[ Ei(k+) | [E ee e o pa 


RS 


y(k) = [bn-1 bn-2 ...bi bo] : » (7.31) 
Tn-1(k) 
Pn(k) 


em que por ser uma outra representação, 
indicamos o vetor de estado por Z para 
diferenciá-lo do vetor de estado x da repre- 
sentação em (7.28). 


Exemplo 7.2.2 


Considere o diagrama de fluxo de sinal 
mostrado na Figura 7.9. 


FIGURA 7.9: Diagrama de fluxo de sinal 
considerado no Exemplo 7.2.2. 


Deseja-se escrever as equações de es- 
tado e de saída para esse sistema. Come- 
çamos indicando as variáveis de estado 
como sendo aquelas à saída dos ramos 


com ganho 21. Claramente, o nó que 


antecede o último ramo com ganho 27! 


tanto corresponde à variável x5(k) (por 
atribuição), como corresponde a x1(k + 
1), por estar antes de um ramo que efe- 


tua um atraso de um intervalo de amos- 
tragem que termina na variável x1(k) 


(colocada nessa posição por atribuição). 
Lembre-se que a representação em espaço 
de estados não é única. Portanto, para a 
equação dinâmica pode-se escrever: 


[aan] = [oo cm JL [Lo Jueo 
Lembre-se que dois ramos que se en- 
contram em um nó devem ter suas saídas 
somadas. Por exemplo, no nó indicado 
go(k + 1) chegam três ramos, um vindo 
de x1(k) com ganho —ay, outro vindo de 
xa(k), com ganho —a, e o terceiro vindo 


de u(k), com ganho unitário. Portanto, 
tem-se que 


ca(k+1)=—agxi(k)—asxo(k)+u(k), (7.32) 


que é a segunda equação dinâmica em 
(7.32). Procedendo do mesmo modo com 
respeito a y(k), tem-se 


y(k) = boxi(k)+biga(k) +boxo(k+1). (035) 


A Eq. (7.33) não pode ser imediatamente 
utilizada como equação de saída, pois não 
está na forma padrão. É importante fri- 
sar que a equação de saída é uma com- 
binação linear das variáveis de estado e, 
possivelmente da entrada, ou seja, tem 
a forma y(k) = c"a(k) + du(k) em que 
a(k) é o mesmo vetor de estado da equa- 
ção dinâmica. Assim, é necessário rees- 
crever x2(k + 1) em função dos elementos 
de x(k) como 


boxo(k | 1) = bo f agr (k) ayxo(k) 4 u(k)] (7.34) 


e então substituir (7.34) em (7.33) para 
obter a equação de saída na forma dese- 


y(k) = [bo-aobo bi—anbo] a(k)+bou(k). (7.35) 


7.2.2 Forma companheira 
observável 


A forma canônica observável é uma outra re- 
presentação que mantém estreita relação com 
a forma canônica controlável, como visto na 
Seção 8.1.4. O diagrama de simulação de um 
sistema em espaço de estados representado 
na forma companheira observável é mostrada 
na Figura 7.10, onde é possível notar que to- 
das as variáveis de estado x, a x, aparecem 
na saída, independentemente dos valores de 
a; e b;. Essa característica justifica o nome 
dado a essa representação canônica. 


—40 =a1 


FiGUuRA 7.10: Diagrama de simulação da 
forma canônica companheira observável. To- 
das as variáveis de estado aparecem na saída, 
independentemente do valor dos parâmetros 


Ai; € Dj: 


Por inspeção da Figura 7.10, pode-se es- 


crever (veja Exercício 7.7): 


bo 
x (k) 
xo (k) 
y(k)=[10....00] (7.36) 
Ln-1(k) 


que está na assim chamada forma canônica 
companheira observável. Uma representação 
alternativa da forma companheira observável 
é: 


&i(k+1) 0 0 
Za(k + 1) 10 
ta(k+)| |0 1 
En(k + 1) 0 0 


y(k) = [00 ...01] 


0 —ao Zi (k) 
(0) —a1 Zo(k) 
0 —ag2 La(k) 4 
1 —anadl En(k) 
bo 
bi 


(7.37) 


7.2.3 Forma de Jordan 


Considere o sistema mostrado na Figura 7.11. 
Para a parte indicada dentro do quadro tra- 
cejado podemos escrever: 


g(k + 1) = Ax(k) + v(k). 


Da parte à esquerda do diagrama podemos 
escrever que v(k) = G;u(k) e da parte à di- 
reita, y(k) = yax(k). Portanto, chegamos às 
seguintes relações 


H(B+1) = a(h) + Bu(k) (ag) 


que está na forma da representação em es- 
paço de estados. Tomando a transformada 
Z e desprezando condições iniciais, tem-se 


Y(2) = nX(2) 
e, por fim, eliminando X(z) chegamos a 


Y(z) = Br 
os 


que é a função de transferencia do sistema 
mostrado na Figura 7.11 e cuja representação 
em espaço de estados é (7.38). 


FIGURA 7.11: Diagrama de simulação de um 
sistema de primeira ordem. 


A seguir, é composto um sistema de or- 
dem mais elevada pela conexão paralela de 
subsistemas como o da Figura 7.11. Isso é 
mostrado na Figura 7.12. A correspondente 
representação em espaço de estados é conhe- 
cida como a forma canônica de Jordan e é 
mostrada a seguir: 


E 
u(k) TB, E To(k+D | = o FR o 
+ 
E 


FIGURA 7.12: Diagrama de simulação de um 
sistema de ordem n composto pela conexão 
paralela de n subsistemas de primeira ordem 
como o da Figura 7.11. 


ai(k + 1) A O (0) 0 
go(k + 1) O A O 0 
Xn 1(k + 1) 0 (0) An-1 O == (k 19 
Ln(k + 1) 0 0 0 An 
+ 
a 1 
1(k) 
na 
vlk)= [nm 92...yn-1 9h] - (7.40) 
a 
Tn(k) 


A forma canônica de Jordan é muito útil, 
pois representa o sistema completo como sub- 
sistemas desacoplados. O caso mostrado na 
Figura 7.12 e em (7.40) é o mais simples, pois 
supomos que os autovalores A; 1 = 1,...,n 
da matriz A são reais e distintos. Se hou- 
ver autovalores repetidos ou se houver pa- 
res complexos conjugados, a matriz A dessa 


representação canônica pode ser bloco dia- 
gonal em vez de diagonal, a depender do 
posto de (A — A;l), sendo À; um autovalor 
de multiplicidade maior que um. Os deta- 
lhes dessa representação, para o caso em que 
há autovalores repetidos ou complexos con- 
jugados, podem ser encontrados em (Chen, 
1999, Sec. 3.5). 

A seguir, mostra-se que a forma canônica 
de Jordan está relacionada à decomposição 
de uma função de transferência em frações 
parciais. 


Exemplo 7.2.3 


Considere o sistema de segunda ordem 
mostrado na Figura 7.13. 


FIGURA 7.13: Diagrama de simulação de 
sistema de segunda ordem. 


Como visto nesta seção, a forma canô- 
nica de Jordan pode ser escrita por inspe- 
ção a partir do diagrama de simulação da 
Figura 7.13. Portanto, temos em forma 


emo le & et ]+[ 5] 


k 
k 
y(k) = [1/8 1/8] E el a E (7.41) 


Da expressão (7.39), vemos que a função 
de transferência do sistema total pode ser 
escrita como 


Y(2) — 150/8 70/8 


U(z) (2z— 1) (2-0,2) 


que é a decomposição em frações parciais 
de 

Via) Iso 

Wiz) 22 — 1,22+0,2 


Portanto, para obter a forma canô- 
nica de Jordan a partir de uma função 
de transferência, começa-se por realizar a 
decomposição em frações parciais. Note 
que os resíduos são r; = 5;Yi;, O que mos- 
tra que a forma canônica de Jordan, a 
partir de uma função de transferência, 
não é única, pois é possível fatorar os re- 
síduos de infinitas formas diferentes. 


Exemplo 7.2.4 


Na Seção 7.1.3 foi definida a matriz mo- 
dal. Utilizando essa matriz como ma- 
triz de similaridade é possível representar 
um sistema na forma canônica de Jor- 
dan. No Exemplo 7.1.4, (A,b,€”) está 
na forma canônica de Jordan, pois a ma- 
triz A é diagonal (os autovalores são re- 
ais e distintos), e fm = (15) = 12 e 
Boya = —4(35) = —P são os Ra nos 
polos z = 1lez= 0, 2, respectivamente, 
da representação em função de transfe- 
rência. 


7.2.4 Matriz de transferência 


As formas canônicas companheiras controlá- 
vel e observável permitem representar um sis- 
tema dinâmico linear em espaço de estado 


por inspeção, a partir de sua função de trans- 
ferência. Nesta seção percorre-se o caminho 
inverso, ou seja, à partir da representação em 
espaço de estados (7.6) obtém-se a função de 
transferência. 


Na seção anterior, vimos que (7.39) é a 
função de transferência de (7.38). Mesmo 
para sistemas de ordem mais elevada, se a 
representação estiver na forma canônica de 
Jordan, obter a função de transferência não 
é complicado. A seguir deriva-se uma ex- 
pressão que permite determinar a função de 
transferência, ou matriz de transferência para 
o caso multivariável, dada uma representação 
em espaço de estados qualquer. Para isso, co- 


meçamos tomando a transformada Z de (7.6) 


2X(2)— za(0) = AX(2) +BU(z) 
Y()=CX(2)+DU(z), (7.42) 


em que X(z) E 0”, U(z) EC" e Y(z) E O? 
são as transformadas Z de x, u e y, respec- 
tivamente. Como a função de transferência 
é definida para condições iniciais nulas, to- 
mamos x(0) = 0 e reescrevemos a equação 
dinâmica de (7.42) como 


(21-A)X(z) = BU (2) 
X(2)=(21-A)!BU(2), (7.43) 


que substituído na equação de saída de (77.42) 
resulta em 
Y()=C(z1-A) !BU(z) + DU(2) 
G(2)=C(zI-AJ!B+D, (7.44) 


que é a matriz de transferência que tem di- 
mensão px 7. No caso de sistemas SISO (r = 


lep= 1), G(z) = Y(z)/U(z) é uma função 
de transferência. Se o sistema tiver mais de 
uma entrada e/ou mais de uma saída, cada 
elemento da matriz de transferência, G(z) 
é uma função de transferência que descreve 
como uma determinada entrada é “transfe- 
rida” para a saída em questão. 

É possível mostrar (ver Exercício 7.8) que 
a matriz de transferência (7.44) é invariante 
com respeito a transformações de similari- 
dade de suas representações em espaço de es- 
tado (7.6). Esse é um resultado importante, 
pois mostra que a representação em espaço 
de estados em que, apesar de a escolha de va- 
riáveis internas não ser única, a relação da(s) 
entrada(s) do sistema para sua(s) saída(s) in- 
depende dessa escolha. 


Exemplo 7.2.5 


Deseja-se verificar a expressão (7.44). Co- 
meçamos com 
Y(2) 102 + 5 


= 4 
U(z) 22-1,22+0,2º SE, 


que tem a seguinte representação em 
forma companheira controlável 


ER = E: Ro |+| ; EO 


y(k) = [5 10) Es Ê (7.46) 


Aplicando (7.44) temos 


Dto = [510] oo EE 


Para realizar a inversão usaremos o 
seguinte resultado: 


il e 
vi mai maia ; Mo = maga maia (7.47) 
m21 maz detM |-m2z1 mar 


Portanto 


Y(2) 1 ad dl 0 
= 5 10 ! 
U(z) 2122402 | —0,2 Io! 
1 Il 
= 5 10 
Aro! [É] 


Exemplo 7.2.6 


No caso de a matriz A ser diagonal, como 
nos casos simples da forma canônica de 
Jordan, a expressão (7.44) é particular- 
mente fácil de calcular. Considere (7.41). 


= (/81/8] | “q Tt 


| 
E o 150 
= vs Ze 1 (1) 


2— 0,2 
150 
gm 
= (em) 
2z— 0,2 
150/8 70/8 ” 10z+5 


E) G00 201722700) 


A facilidade adicional advém do fato de 
que a inversa de uma matriz diagonal 
também é uma matriz diagonal, em que 
cada elemento é o inverso do correspon- 
dente na matriz original. 


Em (7.44), o termo det(z] — A) corres- 
ponde a det(AI — 4), mas com z no lugar de 
À, pois tal termo surgiu depois de se tomar 
a transformada Z. No Exemplo 7.2.5, o po- 


linômio característico da matriz A em (7.46) 
é igual ao denominador da função de trans- 
ferência (7.45). Portanto, nesse exemplo, os 
autovalores de 4 coincidem com os polos da 
função de transferência. Esse resultado é ver- 
dadeiro desde que não ocorram cancelamen- 
tos de polos e zeros na função de transferên- 
cia. Outra forma de dizer isso é que a realiza- 
ção em espaço de estados deve ser mínima, ou 
ainda, que os polinômios do numerador e de- 
nominador da função de transferencia devem 
ser coprimos, ou seja, não devem ter termos 
em comum. No próximo capítulo veremos 
que essa condição está relacionada a propri- 
edades de controlabilidade e observabilidade 
do sistema. 


Exemplo 7.2.7 


Coloquemos o zero de (7.29) em z = 0,2 
de modo a cancelar o polo na mesma po- 
sição. Assim escolhemos 

ça) = lia pd —25 


— = al 
U(z) 22-1,2240,2. 2-1 o 


que tem a seguinte realização não mií- 
nima em forma companheira controlável 


Rec ES ERIO 


uaj=[5 —25] | 2 |. (7.49) 


O polinômio característico da matriz A 


do sistema (7.49) é 


A — 


Ei Ee »-1,2 


| =MA-1,2)+0,2 


SO OA 02 (0) 


que deve ser comparado com o denomi- 
nador de (7.48) antes da simplificação. 
De (7.50) conclui-se que o sistema tem 
autovalores z = 1ez = 0,2, mas este 
último não é polo da função de transfe- 
rência (ver Eq. 7.48). Fica como exercício 
verificar que o uso de (7.44) resulta em 
(7.48) antes de cancelar o polo e o zero 

Resumindo, todo polo da função de 
transferência também é um autovalor de 
A, mas um autovalor de A pode não ser 
um polo da função de transferência, se 
este for cancelado por um zero, como ilus- 
trado neste exemplo. 


7.3 Solução das Equações 
de Estado 


Nesta seção encontramos uma expressão fe- 
chada para à solução da equação de estado. 
Esse desenvolvimento é útil para definir uma 
matriz que é importante na representação em 
espaço de estados. Começamos com o caso 
discreto no tempo e, na Subseção 7.3.2 resol- 
vemos o caso contínuo. Feito isso é possível 
comparar os resultados para ver que relação 


existe entre os dois desenvolvimentos. 
partir da equação dinâmica (7.6) pode- 
mos escrever 


e(1) = Ax(0) + Bu(0) 
e(2) = Azx(1) + Bu(l) 
=  A[Awx(0) + Bu(0)] + Bu(1) 
—  Ag(0) + ABu(0) + Bu(1) 
e(3) = Agx(2) + Bu(2) 


= A[A2x(0) + ABu(0) + Bu(1)| + Bu(2) 
— Aix(0) + A2Bu(0) + ABu(1) + Bu(2). 


Portanto, uma expressão geral para o vetor 


de estado no Instante k é 
k-1 
Afx(0) + > A"Bu(k — 1 —n) 


n=0 


APa(o)4S AI" Bu(n). (7.51) 


A Eq.7.51 mostra que o valor do vetor 
de estado em um instante k depende de uma 
parcela oriunda das condições iniciais a(0) 
e de outra devida ao sinal de entrada. Es- 
sas parcelas correspondem às soluções natu- 
ral (resposta de entrada nula) e forçada (res- 
posta com condições iniciais nulas) de equa- 
ções diferenciais ou de diferença. 

A matriz de transição de estados é def- 
nida como: 

d(k) = A, (7.52) 
de forma que a Eqg.7.51 pode ser reescrita 
como 

k—1 


e(k) = Ph)z(0)+> Pk-1-n)Bu(n). (7.53) 


n=0 


Portanto, a matriz de transição de esta- 


dos descreve como o sistema move o estado 
em determinado instante para um tempo fu- 


turo para entrada nula. Da expressão (7.53) e 
da equação de saída (7.6), é imediato chegar 
a 


k—1 
v(k) = CO(k)x(0)+5) CP(k-1-n)Bu(n) + Du(k). (7.54) 


n=0 


A primeira parcela do lado direito de (7.54) 
corresponde à solução natural do sistema, ou 
ainda à solução de entrada nula. Para ver- 
mos que o restante do lado direito de (7.54) 
corresponde à solução forçada, ou em outras 
palavras, à solução de estado nulo, usamos 
a seguinte definição da matriz de resposta ao 
impulso do sistema: 


D, k=0 
FEQaje= À CAMIB, k>0 Rio) 


em que CAMIB, k > 0 são chamados pa- 
râmetros de Markov. No caso de sistemas 


em tempo discreto, os parâmetros de Mar- 
kov coincidem com a resposta ao impulso. 
Assim, tem-se: 


Co(k-1-n)B=CAtI-"NB=CH(k-nB, (7.56) 


e, substituindo o resultado (7.56) no lado di- 
reito de (7.54), logo reconhecemos o somató- 
rio de convolução entre a (matriz) resposta 
ao impulso e o vetor de entradas u(k). Por- 
tanto, À saída do sistema em (7.54) é obtida 
aplicando-se o princípio da superposição da 
resposta para entrada nula (natural) com a 


resposta de estado nulo (forçada). 

A matriz de transição de estado tem as se- 
guintes propriedades, cuja verificação é ime- 
diata: 


Es A 


a 
[v 
— 


Afrtho — Aki 4b2 — D(ky)D(ko) (7.57) 
—k (ABy-1 D(k)! 
—k)- 1. 


II RAE 


e 
dn 


A segunda propriedade em (7.57) mostra 
que a matriz dinâmica A no caso discreto 


corresponde à matriz de transição de esta- 
dos quando o intervalo de transição é k = 1, 
ou seja, um intervalo de amostragem, o que 
é evidente da relação a(1) = Ax(0). 


7.3.1 Relação com a 
transformada Z 


Nesta subseção desejamos representar a ma- 
triz de transição de estados P(k) em termos 
da transformada Z. Para isso consideramos 
u(k) = O e tomamos a transformada Z da 
equação dinâmica de (7.6) para chegar a 


2X(2) — zae(0) AX(2) 
(21 — A)X(2) = za(0) 
X(2) = (27 - AJTtze(0) 
a(h) = 2Ha(2l — AJ Ia(o), 


que, comparando com (7.53) para u(k) = 0, 
permite escrever a matriz de transição de es- 


tados em termos da transformada Z como 


d(k) = ZH2l- AJ. (7.58) 


Exemplo 7.3.1 


Deseja-se encontrar uma expressão para 
a matriz de transição de estados do sis- 
tema dinâmico linear em tempo discreto 
com matriz dinâmica (Phillips e Troy Na- 
gle, 1995, p. 74) 


Usando a definição em (7.52) tem- 
se uma expressão para P(k). O uso da 
transformada Z e da definição em (7.58) 
permite encontrar uma outra expressão, 
como mostrado a seguir. Para esse sis- 
tema, tem-se 


fer 4) = [5 43) 


portanto |2! — A|= (2 +1)(z+ 2). Para 
realizar a inversão usaremos o seguinte 
resultado: 


M=| mai maz | gps 1 mas mas | 
m21 ma2 detM | —-m2 mai 


portanto, usando (7.47) e multiplicando 
por z temos 


ER 1 
api) es | 


Z(z+3) z 
=22 22 


cuja transformada inversa Z resulta na 
matriz de transição de estados 


E Dr Cn 
ER. IME o (E 2) AR (En) to (ok E 


Portanto, P(k) mostra para onde o vetor 
de condições iniciais é mapeado k itera- 
ções no futuro. 


7.3.2 Relação com o 
caso contínuo 


Nesta seção obtemos as matrizes de estado 
para o caso discreto a partir do conhecimento 
das matrizes correspondentes para o caso con- 
tínuo e do intervalo de amostragem 7. 

Um sistema linear e invariante no tempo 
em tempo contínuo pode ser representado em 
espaço de estados como: 


x = Ax+ Bu 
y = Com Du, 


em que o subscrito “c” indica que as matrizes 
se referem a um sistema de tempo contínuo. 
A solução completa dessa equação diferencial 


dada a condição inicial x (to) e uma entrada 
u(t), t E [to t| é a soma das equações (7.96) 
e (7.105) derivadas no Complemento 7.1, o 
que resulta em: 


a(t) = Sttoda(to) + [ cAc t-DBou(r)dr, (7.59) 
to 
que é o análogo em tempo contínuo da ex- 
pressão (7.51) para o caso discreto. Consi- 
derando a solução ao longo de um período 
T, ou seja, tomando t;, = kTet=kT+T, 
temos 
kT+T 

a(KT+T) — ATa(kT)+ Á 1 AMET Bru(r)dr. (1.60) 
Supõe-se que o vetor de entradas não muda 
durante esse intervalo, ou seja, considera-se 
que u(r) =u(kT), kT <7<kT+T. Essa 
consideração corresponde a assumir que cada 
elemento de u é a saída de um segurador de 
ordem zero. Fazendo a mudança de variáveis 


n=kV+T-7, a Eg. 7.60 pode ser reescrita 
como: 


a(kT+T) = AT e(kT) + fê e4M (-an)) Beu(kT) 


E: ([ erman) Beu(kT), (7.61) 


= A Te(kT 


— 


portanto (compare com a equação dinâmica 
em (7.6)) tem-se que 


As DT) e": (7.62) 


B- ( / ; dm) Bo (763) 


ou seja, a matriz de entrada B para o sis- 
tema discreto com intervalo de amostragem 
T pode ser obtida a partir das matrizes do 
sistema contínuo correspondente A. e B.. Por- 
tanto, as equações (7.62) e (7.63) fornecem 
as matrizes discretas 4 e B a partir de ma- 
trizes análogas no caso contínuo. Deve ser 
notado que e*, em que X é uma matriz, não 
é a exponencial dos elementos da matriz. O 
comando Matlab para realizar a exponencial 
de uma matriz é expm. Por outro lado, o co- 
mando exp de uma matriz faz a exponencial 
elemento por elemento. 


Do ponto de vista numérico, é preferível 
utilizar um outro procedimento. Usando a 
expansão em série 


oo p 
dt = 34, 
n! 

n=0 


podemos reescrever (7.62) como 


AZT?  AST8 
A-B(T)=I+ ATA a ai E... (7.64) 


Semelhantemente, utilizando (7.64) em 
(7.63) temos: 


(sem ES 


ER A2n2 ASp3 
n n 
1 + Acnd = | a “| dn] Bo 
[/ ( a Ti ) em) 


AT? | ATS  ABTA 


[ira | | 
2! 3! 4! 


B 


II 
=> 

Eu 
3 


o Bo. (7.65) 


Portanto, (7.64) e (7.65) podem ser utili- 
zados para determinar numericamente as ma- 
trizes da equação dinâmica de um sistema 


discreto representado em espaço de estados 
a partir das respectivas matrizes do análogo 
em tempo contínuo. Está claro que é neces- 
sário truncar tais expressões. O uso de três 
termos da expansão leva a uma precisão de 
três casas decimais e o uso de cinco termos 
garante precisão de seis casas decimais (Phil- 
lips e Troy Nagle, 1995, p. 159). 

Por fim, deve ser notado que, como a equa- 
ção de saída de um sistema representado em 
espaço de estado é algébrica, a discretização 
não altera as matrizes, portanto CU = Ce 
D= Da 


Exemplo 7.3.2 


Seja um sistema em tempo contínuo cuja 
representação em espaço de estados é dada 


pelas matrizes: 


na Dodo 0 0 
ea o o 2 0 
e As Eno 
Da oa pd 
DR 0 0 
Ce E mp Gg] Dos [6 E 


A seguir obtém-se as matrizes de ver- 
sões discretizadas desse sistema, assu- 
mindo que o tempo de amostragem é 
T = 0,1. Usando 


AZT2  ABT3 
Mo CA 


A=I+A TA 


obtém-se: 


Cm 0 0 

O 0,8187 0 0 

0 0 0,6042 0,8758 |" 
0 0 0 0,9048 


cujos autovalores estão na diagonal prin- 
cipal, por ser essa matriz triangular su- 
perior. A matriz encontrada usando o 
comando do Matlab c2d com o método 
zoh fornece uma matriz com autovalores 
iguais até a quarta casa decimal à ex- 
ceção de As = 0,6065, que é levemente 
diferente. De modo semelhante, usando 


AE aee 
B — IT T 91 [ 3]! od 
obtém-se: 
0,0093 O 
(o isca) 
= o 02007 E 
0 0,0952 


que é praticamente idêntica à versão ob- 
tida usando o comando do Matlab c2d 
com o método zoh. As matrizes C e D 


são iguais às do caso contínuo, como dis- 
cutido ao final da Seção 7.3.2. Portanto, 
vemos que não é necessário utilizar um 
grande número de elementos nas séries 
infinitas (7.64) e (7.65) para se conseguir 
uma boa aproximação. 


7.4 Sistemas 
Realimentados 
em Espaço de Estados 


Em um sistema realimentado, a entrada não 
é independente do sistema, ou seja, a entrada 
depende do estado em que o sistema se en- 
contra. Assim, em linhas gerais, escrever um 
sistema realimentado em espaço de estados 
implica usar o fato de que u(k) depende de 
a(k) e rearranjar os termos de modo ade- 
quado. 


De certa forma, esta seção é análoga à Se- 
ção 5.1, pois o objetivo é, dado um sistema 
de controle amostrado representado em dia- 
grama de blocos, encontrar sua representa- 
ção em espaço de estados. O procedimento é 
discutido no contexto de exemplos. 


Rs 


Exemplo 7.4.1 


Considere o sistema realimentado mos- 
trado na Figura 7.14. Deseja-se obter 
uma representação em espaço de estados 
em tempo discreto para o sistema como 
um todo. O primeiro passo é enxergar 
a parte do sistema que seja em tempo 


contínuo como um subsistema e, a partir 
daí, encontrar a representação em espaço 
de estados de tempo contínuo para essa 
parte. A seguir essa representação deve 
ser discretizada, por exemplo usando os 
resultados da Seção 7.3. Por fim, o sis- 
tema deve ser completado utilizando as 
variáveis discretas no tempo. 


O o | CU q A Gu(s) Pe 
H(s) 


FIGURA 7.14: Diagrama de blocos do 
Exemplo 7.4.1. 


O primeiro passo é substituir o con- 
junto amostrador-função de transferên- 
cia por um amostrador ideal, seguido de 


um Z0H e da função de transferência da 
planta. No presente exemplo temos: 


1 5 
“e Rs 


Gpi(s) = 1 Gpo(s) 


2 
s(s + 2) 

Lembre-se que na Seção 7.3, para pas- 
sar da Eq. 7.60 para a Eq. 7.61 foi suposto 
que a entrada do sistema não varia den- 
tro de um mesmo intervalo de amostra- 
gem, em outras palavras, supõe-se que 
as entradas do sistema contínuo sejam 
as saídas de seguradores de ordem zero. 
Portanto, é conveniente redesenhar o sis- 
tema de tal modo que as saídas dos ZOH 
sejam as entradas do subsistema contí- 
nuo. Isso é mostrado na Figura 7.15, em 
que a parte em linha pontilhada indica o 
subsistema contínuo. 


FIGURA 7.15: Diagrama de blocos da 
Figura 7.14 redesenhado (Phillips e Troy 
Nagle, 1995, p. 184). O subsistema contí- 
nuo está indicado pela caixa pontilhada. 


T=0,1. 


Começamos encontrando uma repre- 


sentação em espaço de estados em tempo 
contínuo para a parte dentro da linha 
pontilhada na Figura 7.15. Note que para 
esse subsistema as entradas no domínio 
do tempo são as saídas dos seguradores 
de ordem zero, ou seja, er(t) e es(t), e as 
saídas y(t) e es(t). Portanto, representa- 
se o sistema na forma: 


v = Av+B | a | 
| e | = Cim (7.66) 


A fim de encontrar as matrizes 
(Ac, Be, Co) O subsistema em tempo con- 
tínuo, indicado pelas linhas tracejadas na 
Figura 7.15, é escrito na forma de um 
grafo de fluxo de sinal. Começamos co- 
locando dois integradores para Gp,(s) e 
mais dois, um para Gp,(s) e outro para 


H(s). O grafo resultante é mostrado na 
Figura 7.16 e a representação em espaço 
de estados é 


FIGURA 7.16: Grafo de fluxo de sinais 
do subsistema contínuo do diagrama de 
blocos da Figura 7.14. "= 0,1. 


As matrizes em tempo discreto são: 


1,0000 0,0906 0 0 
ER no geisr 0 
a 0 0 0,6065 0,3729 
0 0 0 0,9048 
0,0094 0 
(ts 
em (O one! E (1.68) 
0 0,0952 


eCl- €C ebDjp= D; Tais matrizes 
podem ser obtidas usando o resultado da 
seção anterior ou utilizando algum pro- 
grama de computador, como o Matlab e 
seguindo os passos: 


% matrizes do sistema contínuo 
Ac=[0 10 0;0-200;00-55;000 -1]; 
Be=[0 0:20:00 40 1]; 

Cc=[0 0 0 1;1 0-1 0]; 
Dc=zeros(2,2); 

T=0.1; ) tempo de amostragem 
% sistema em tempo contínuo 
Sysc=ss(Ac,Bc,Cc,Dc); 

% sistema em tempo discreto 
Sys=c2d(Sysc,T,'zoh?); 

A=Sys.a 

B=Sys.b 

C=Sys.c 

D=Sys.d 


A representação discreta em espaço 
de estados (41, Bj, C1, D1) corresponde à 
parte dentro da caixa de linhas traceja- 
das na Figura 7.15 e chamando de x(k) o 
vetor de estado em tempo discreto, tem- 
se: 


vlk) = Ge(k). (7.69) 


A entrada do sistema em tempo dis- 
creto completo é r(k). Portanto deve- 
mos reescrever (7.69) de maneira a re- 
fletir isso. Deve ser observado que a 
entrada do sistema (41, B,,(1,D1) é o 
vetor [es(k) es(k)]". O sinal discreto 
es(k) coincide nos instantes de amostra- 
gem com es(t), e(t) e alt), sendo que o 
mesmo é verdade para es(k). 

Neste exemplo, temos usado o sím- 
bolo v(t) para indicar variáveis de estado 
do sistema contínuo, e x(k) para o sis- 
tema discreto. Assumindo que v;(t) = 
gi(kT), t = kT, passamos a usar z;(k) 
no lugar de v;(t). Portanto, para o sis- 


tema discreto podemos escrever 


El a ba = talk) | 


co(k) gi(k) — xa(k) 
= E : ” Gl a(k) + | r(k) 
= Cog(k) + Dor(k). (7.70) 


Por fim, substituindo (7.70) em (7.69) 
tem-se 


e(k + 1) = Ayx(k)+B [Cox(k) + Dor(k)] 
= [A+ BiCo] 2(k) + By Dor(k) 
y(k) =[0 00 1x(k). (7.71) 


Portanto, o sistema completo em tempo 
discreto é caracterizado pelas matrizes A = 
A + BO, B = B,Ds, O = [0 0) O) 1] 
ea): 


7.4.1 Sistemas com controlador 


Quando o sistema realimentado tem contro- 
lador a representação fica um pouco mais 
complicada. Para descrever o procedimento 
geral, consideremos um sistema em tempo 
discreto, como o ilustrado na Figura 7.17. 

O primeiro ponto a observar é que na re- 
presentação em espaço de estados, o vetor de 
estados inclui todos as variáveis de estado do 
sistema. No Exemplo 7.4.1, o vetor de estado 
a(k) inclui duas variáveis de estado referen- 
tes a Gp, (s), uma referente a Gp, (s) e outra 
de H(s). Assim, com respeito ao sistema da 
Figura 7.17, começamos notando que a(k) 
inclui as variáveis de estado do controlador 
D(z) bem como as de G(z). Contudo, há 
duas entradas para os subsistemas: a entrada 
do controlador e(k) e a entrada da função de 
transferência de pulsos, G(z), ou seja m(k). 
A malha fechada tem uma entrada u(k) e 
uma saída y(k). Assim, começamos escre- 


vendo 
a(k+1) = Aa(k) + Bim(k) + Boe(k) 
ylk) = Co(k), (7.72) 


e desejamos terminar com uma representação 
na forma padrão 


e(k+1) = Ax(k) + Bu(k) 
vlk) = Ca(k). (7.73) 


FIGURA 7.17: Sistema de controle em tempo 
discreto. 


Para o controlador D(z), podemos escre- 
ver a seguinte equação de saída 


m(k) = Crx(k)+ Dre(k), (7.74) 


sendo que o sinal de erro é dado por 


ek) = uk) —y(k) 
u(k)— Ce(k). (7.75) 


Substituindo (7.74) e (7.75) em (7.72) obte- 


mos 


e(k+1) = Asa(k) + By [Cra(k) + Die(k)] + Boe(k) 
= [4+Bi,Cijx(k)+[B, Di +B4] [u(k)-Co(k)] 
= [41+B1Ci-(B1 Di +Bo)C]e(k)+[B1 Di+BoJu(k) 
yulk) = Ca(k), (7.76) 


que está na forma procurada (ver Eg. 7.73). 
Esse procedimento é ilustrado no próximo 
exemplo. 


ido 
Bis 


Exemplo 7.4.2 


Neste exemplo deseja-se escrever as equa- 
ções de estado para o sistema da Fi- 
gura 7.18 (Phillips e Troy Nagle, 1995, 
p. 189) com as seguintes funções de trans- 
ferência: 


Se alii 10 
os se) 


+ E mk) m(k) ; y 
10% | Dt) [PjzonP HI o(s 


FIGURA 7.18: Sistema de controle amos- 
trado com P = 0,1s. 


A representação em espaço de esta- 
dos em tempo discreto com T = 0,1s da 


parte contínua do sistema é dada por (ver 
Exercício 7.15): 


Ea 5 li o oo 


go(k-+1) O 0,9050 || x>(k) 0,9520 
y(k) = [1 0 ]Ja(h). (7.77) 


A seguir devemos encontrar as equa- 
ções de estado para o controlador. Como 
D(z) é uma função de transferência pró- 
pria, após uma iteração de divisão longa 
pode-se escrever (ver Exemplo 7.2.2 e 
Exercícios 7.3 e 7.4) 

un OS 0,01 


D(2)= = =0,9 
(DO CEE ET 


Portanto, a representação em espaço 
de estados do controlador pode ser es- 


crita como: 


m(k) = 0,01x3(k)+0,9e(k), (7.78) 


em que usamos x3 para indicar a variável 
de estado do controlador, uma vez que 
x e 13 foram usados para a planta ante- 
cedida do Z0H. Incluindo a equação de 
ta(k + 1), ver (7.78), nas equações dinã- 
micas da associação ZOH e modelo da 
planta em (7.77) temos: 


ER F 0,0952 O MIEIE 
go(k+1) | =| 0 0,9050 O || xa(k) 
gs(k+1) 0 0 va(k) 


0,0484 
AE E m(k) + HE e(k), (7.79) 
0 


que está na forma a(k + 1) = Aja(k) + 
bim(k) + boe(k). Como desejamos ter- 
minar com a representação em espaço de 


estados, é necessário que essa relação en- 
volva apenas x e u, portanto, devemos 
substituir m(k) e e(k) por expressões equi- 
valentes em termos das variáveis de in- 
teresse. Como o vetor de estado agora 
inclui x3 e supondo que a variável con- 
trolada seja 74, pode-se escrever: 


e(k) 


= u(k) — y(k) 

u(k) — [10 OJx(k) 

[-10 OJa(k) + u(k) 

= cje(k) + diu(k). (7.80) 


A Eq. 7.78 pode ser reescrita como 


m(k) 


= [00 0,01]e + 0,9e(k) 
= cle(k)+ de(k). (7.81) 


Substituindo (7.80) em (7.81) tem-se 


m(k) = cia(k)+ dolefax + dyu(k)] 
= [e7+dscl]z(k)+ dodyu(k). (7.82) 


Por fim, substituindo (7.80) e (7.82) 
em (7.79), temos 


e(k+1) = Ae(k) + biflez + docl]x(k) + dodyu(k)) + 
+balera(k) + diu(k)] 

= (Ai + bi [ez | doer] | boci ra(k) + 
+[bi da di + bodiju(k) 

y(k) = [1 0 Ojx(k), (7.83) 


que está na forma procurada. 


Exemplo 7.4.3 


Neste exemplo o resultado do Exem- 
plo 7.4.2 é validado. Para isso, seguimos 
um procedimento que utiliza unicamente 
funções de transferência. Começamos en- 


contrando a função de transferência de 
pulsos, que corresponde à transformada 
Z do segurador de ordem zero seguido de 
G(s). Consultando a tabela de transfor- 
madas, chega-se a: 


ee E ig (2001) 


-— of 5 del am 5) 


of = sea (ft = =] 
(= Dita e") 
0,0484z + 0,0468 
22 — 1,9048z + 0,9048' 


usando 7 = 0,1s. Utilizando a função de 
transferência D(z) dada para o controla- 
dor, a função de transferência de malha 
fechada é: 


YO) Deoc(E) 
U(z) 1+ D(z)G(z) 
0,0435422-+0,003412—0,03743 
23-2,76122+2,6232-0,8518 


(7.84) 


A resposta ao degrau, obtida por si- 
mulação de (7.83) e de (7.84) é mostrada 
na Figura 7.19. Como pode ser visto, as 
respostas coincidem. 


2 
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o) 
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FIGURA 7.19: Resposta ao degrau de 
(7.83) indicada por círculos, e de (7.84) 
indicada por cruzes. 


Os comandos usados na produção da 
Figura 7.19 são: 


) Matrizes em espaço de estado discreto 
% à parte continua do diagrama de blocos 
T=0.1; ) Tempo de amostragem 

A=[1 1-exp(-T);0 exp(-T)]; 

b=[T T-1+exp(-T);0 1-exp(-T)]*[0;10]; 
ec=[1 0]; 

d=0; 


% Matrizes que incluem o controlador 
At=[A(1,:) O;A(2,:) 0:00 0.9]; 
bi=[b;0]; b2=[0;0;1]; 

ci=[-1 0 0]; c2=[0 O 0.01]; 

di=1; d2=[0.9]; 

) Matrizes de estado para o sistema completo 
AA=Ai+bl*(c2+d2+cl)+b2xc1; 
bb=bixd2+xdi+b2+d1; 

ce=le 0]; 

sys=ss(A,bb,cc,0,-1); 
y=step(sys,100); 


% solução via função de transferência 


% função de tranferência de pulsos 
nump=10*[T-i+exp(-T) 1-exp(-T)-T+exp(-T)]; 
denp=conv([1 -1],[1 -exp(-T)]); 


4% função de transferência do controlador 
numd=[0.9 -0.8]; 
dend=[1 -0.9]; 


4% função de transferência de ramo direto 
num=conv (numd, nump) ; 

den=conv (dend, denp) ; 

MA=tf (num,den,-1); 


4% função de transferência de malha fechada 
MF=feedback(MA,1); 

yft=step(MF,100); 
plot(1:100,y,ºko”?,1:100,yft,ºk+); 


Na primeira parte do código acima, a 
matriz A e o vetor b são determinados a 
partir da matriz de transição de estados 
contínua para T = 0,1s (ver Eg. 7.62 e 
Eq. 7.63). 


7.5 Complementos 


Complemento 7.1. Solução da equação de 
estado em tempo contínuo 


Este complemento é o análogo em tempo 


contínuo dos resultados obtidos para tempo 
discreto na Seção 7.3. Como no caso contí- 
nuo a solução procurada deve atender a uma 
equação diferencial, o desenvolvimento ma- 
temático é um pouco mais elaborado do que 
sua contraparte em tempo discreto. A seguir 
dividimos o problema em duas partes. Pri- 
meiro, resolvemos a equação diferencial ho- 
mogênea e, depois, a particular. 


7.5.1 Solução da equação 
diferencial homogênea 
Começamos considerando a representação em 


espaço de estados de um sistema LIT em 
tempo contínuo: 


x = Ax+4 Bu 
y = Cr+Dau, (7.85) 


em que o subscrito “c” indica que as matrizes 
se referem a um sistema de tempo contínuo. 


No desenvolvimento a seguir, usamos a defi- 
nição da exponencial de uma matriz: 


t” 
Ato j n 


n=0 


Considerando o caso homogêneo, ou seja 
u = 0, em (7.85), a solução xn(t) para a 
condição inicial gn(to) deve satisfazer 


Zn =— Ac. (7.87) 


Como Ac define um campo vetorial suave, 
a solução xn(t) também é suave e, portanto, 
pode ser expandida em uma série em torno 
do instante inicial, ou seja, 


en(t) = Ko+Ki(t-to)+Ko(t-to)2 +... (7.88) 

Como zn(t) é solução de (7.87), então de- 

rivando (7.88) e substituindo em (7.87) tem- 
se: 


Ki+2Ko(t-to)+3Ks(t-to)2+...— Acan(t). (7.89) 


Tomando t = to em (7.88) e (7.89), obtém- 
se, respectivamente, que Ko = Zn(to) e Ki = 
Aãn(to). Derivando (7.89) em relação ao 
tempo chega-se a: 


2Ko+6Ks(t—to) + 24Ku(t—to)? = Actn(t) 
2K5+6Ka(t—to) + 24Ka(t-to)2... — AZen(t). (7.90) 


Como feito anteriormente, tomando t = to 
em (7.90) chega-se a K, = Alxn(to)/2. 
Dando continuidade a esse procedimento, o 
que é possível graças ao fato de o campo ve- 
torial ser suave e, portanto, diferenciável tan- 
tas vezes quanto necessário, as constantes da 
expansão (7.88) satisfazem 


n 


Aç 
Kn = —[8n(to), (7.91) 


logo, a expansão (7.88) pode ser escrita como: 


Aeft=to)* 
agn(t) = I+Act to) + do 0) + 


Astt=to)* 
ga E 0) 


A parcela entre colchetes na Eq. (7.88) é a 
exponencial da matriz (compare com a defi- 
nição da Eg. 7.86) 


Act—to)? 
21 


gdcltto) = I+ Act to) | 


Acti=to)” 
E (t—to) 


a +. (7:98) 


Usando (7.93) em (7.92) chegamos a 
en(t) = Spy (to), (7.94) 


de onde segue que, por definição, a matriz de 
transição de estados para o caso contínuo é 
definida como (assumindo to = 0): 


O) (7.95) 
de maneira que (7.94) pode ser escrita como 


mn(t) — De(t = to)xn(to). (7.96) 


Uma expressão para a matriz de transi- 
ção de estados em tempo contínuo análoga 
ao caso discreto mostrado em (7.58) é (ver 
Exercício 7.13 e Exercício 7.14) 


dt) = CH(sI-AJD. (7.97) 


Como no caso discreto, a matriz de tran- 
sição de estados indica para onde o vetor de 
estado em ty é mapeado no instante t. Como 
se trata do caso contínuo et E IR, Pt — to) 
indica como o vetor de estado evolui ao longo 
do tempo. 

Uma propriedade usada a seguir pode ser 
deduzida de (7.95) e de (7.57). Em particu- 
lar, por analogia com a primeira e terceira 
entidades em (7.57) tem-se: 


De(t—t) = O(0) =1= D(t)D(—t) (7.98) 
e de (7.95) podemos escrever 


D(D)D(-t) =ette At = 7, (7.99) 


ou seja, a troca de sinal da matriz na ex- 
ponencial corresponde a tomar a inversa da 
matriz de transição de estados. 

Considere um sistema cujo estado inicial 
seja Zn(to) e, para u = O deseja-se conhe- 
cer esse vetor T” unidades de tempo depois. 
Usando (7.96) temos 


Lnlto HT) — Dlto+T— to)zn(to) 
Tnlto +T) = SA(Dan(to). (7.100) 


A Eq. 7.100 corresponde a uma transição dis- 
creta com intervalo 7, ou seja, é o equiva- 
lente a um sistema dinâmico em tempo dis- 
creto, sendo que a matriz 9.(7) faz o papel 
da matriz dinâmica A do sistema discreto. 
Por fim, chega-se à seguinte relação: 


que é análoga à conhecida relação z = e”. 


7.5.2 Solução particular da 
equação diferencial 
Passemos agora a encontrar a solução par- 
ticular xp(t) para o sistema (7.85). Como a 
solução da equação homogênea é an(t—to) = 
eiTg(to), supomos que a solução particular 

é da forma 


go(t) = eSCtody(t), (7.101) 


em que v(t) deve ser determinado. Substi- 
tuindo (7.101) em (7.85) tem-se: 


Lp = Acxp + Bu 
Açedet-to)y(t) + edet-toda(t) = Açedct-to)y(t) + Beu 
edet-tody(t) — Beu (7.102) 


e usando a propriedade (7.99) pode-se escre- 
ver: 


v(t) = Sto Bou(t) 


t 
ultj= [ e"Banrjar, (7.103) 


to 


em que se assumiu que u(t) = 0, t < to. 


Substituindo (7.103) em (7.101) 


t 
mo(etetof eito-NBu(T)dr. (7.104) 


to 


Agora, por analogia com a terceira pro- 
priedade em (7.57) é possível escrever: Pe(to— 
T) = Boto — t)Pc(t — 7), que pode ser usada 
na integral da Eq. 7.104, o que resulta em 


t 
Colt ER efecto) At) Bu(r)dr 


to 


t 
— GAt-t0) Alto) / est B.u(r)dr 


to 


fe (7 Beu(T)dr, (7.105) 


(0) 


que é uma integral de convolução. 


Complemento 7.2. Modelo do pêndulo 
invertido 


Considere o pêndulo invertido mostrado 
na Figura 7.20. Fazendo o balanço de forças 
horizontais que atuam sobre o carrinho e so- 
bre a haste é possível chegar ao modelo do 
pêndulo invertido! 


(M +mji+bi+mlôcos60 —mtB2sen) = F 
(1 + mt2)0 + mgtseng —mtlãk cos0. 


(7.106) 


Inttp://www2.ensc.sfu.ca/people/faculty/ 
saif/ctm/examples/pend/invpen.html 


FIGURA 7.20: (a) Pêndulo invertido, (b) ba- 
lanço de forças. 


Linearizando (7.106) em torno de um 
ponto de operação, que neste caso é a po- 
sição vertical da haste, tem-se ) = 0 — 7, em 
que à indica variações em torno da posição 
vertical. Nessa posição tem-se cos0 = —1, 
send = sen(g +71) = -seng x —g eba 0. 
Assim, as equações linearizadas são: 


(MEmi+rbi-mtp = F 
Im -mgto = mê. (7.107) 


A representação em espaço de estados pode 
ser obtida com o vetor de variáveis de estado 
ag = [x à 4 q” com as seguintes matrizes (ver 


Exercício 7.26): 


0 1 0 0 
0 —(Utmt2)b m2gt2 0 
Aus MAM AMme MEm)HMmt2 
cs 
0 0 0 1 
0 —mbb mgyUM-+m) 0 
IME) AM MEM) AMmt2 
0 
im EST 1000 
= MM+m)+Mmt2 se. 
bo = ú Cc= [o 0 1 017108) 
ml 
MEM) +MmtZ 


e De = [0 0/”. O pêndulo pode ser simu- 
lado com os seguintes valores de parâmetros: 
M =08kg;m = 0,2 kg; b = 0,1N/m/seg; 
1 =0,009kg(m?): q = 9,8m/seg?; (= 0,4m. 


Exercícios 


No mesmo lugar onde baixou os scripts ini- 
ciais, isto é, em 


também se encontram outros dois: 
simrk ph teste eee pH linear, que estão 
incluídos no mesmo arquivo compacatado: 
Modelo de pH MATLAB espaco de estados linear.zip. 
Baixe e descompacte esse arquivo. 


As seguintes perguntas dizem respeito 
ao script simrk ph teste ee. O mo- 
delo não linear foi linearizado em torno do 
ponto de operação que se alcança para va- 
zão de ácido forte 3ml/s e vazão de base 
forte 2ml/s. Os parâmetros encontram-se 
no script pH linear, que é chamado por 
simrk ph teste ee. A discretização foi re- 
alizada para um tempo de amostragem de 
T=40s. A matriz A resultante é uma matriz 


diagonal com elementos: 
A = diag[0,031 0,791 0,791 1,0 1,0 1,0 1,0]. 
A respectiva matriz de entrada, B é: 


0,1545 0,1545 
247x10-4  —2,49x10-4 
—4,56x105 —4,15x 105 


B'= —0,0303 0 : 
0 0 
0 —0,0303 
0 0 


em que a primeira coluna corresponde à va- 
zão de ácido forte e a segunda, à vazão de 


base forte. 


1. Reconheça no código onde e como se 


simula o modelo linearizado; 


2. qual é o valor das variáveis de estado 


no ponto de operação? 


3. qual é o valor do pH no ponto de ope- 
ração? 


4. analise a estabilidade do modelo linea- 
rizado; 


o. observando que a matriz A é diagonal, 
discuta a controlabilidade do par (4, B); 


6. o pH é uma função não linear dos esta- 
dos x3 e x3, sendo que, na prática, essa 
grandeza é medida por um peagâmetro. 
Supondo que x, e x3 fossem medidas 
individualmente, proponha uma matriz 
de saída C para refletir isso. Discuta a 
observabilidade do par (4,C) à luz de 
que se trata de uma planta de pH em 
que essa é a variável a ser controlada. 


7.1. Aplique a transformada Z à Eq.7.1 
e considere condições iniciais nulas. Mostre 
que tal equação de diferenças corresponde a 
uma função de transferência com um polo. 


7.2. Repita o procedimento de mudança de 
coordenadas descrito no início da Seção 7.2, 
mas ao invés de usar (7.9), empregue Z(k) = 
Pa(k). 

7.3. Siga procedimento análogo ao da Se- 
ção 7.2.1 para mostrar que o diagrama de 
fluxo de sinal da Figura 7.9 corresponde à 
função de transferência própria: 
Ee dor tbiz+bo 

2º + az + 00 

7.4. Partindo da função de transferência pró- 
pria (7.109), use divisão longa (polinomial) 
para reescrevê-la como a soma de uma cons- 
tante e uma função de transferência estrita- 
mente própria. Represente essa função de 
transferência em espaço de estados, por ins- 
peção, usando o resultado em (7.28). In- 
corpore a esse resultado o efeito resultante 
da parcela constante e mostre que o resul- 
tado final corresponde ao indicado no Exem- 
pló: 7.2.2. 


(7.109) 


7.5. Verifique que (7.28) e (7.31) estão re- 
lacionadas por uma transformação de simi- 
laridade definida por uma matriz P que tem 
1's ao longo da diagonal NE-SO (nordeste- 
sudoeste) e zeros nas demais posições. Ve- 
rifique que a mesma matriz de similaridade 
relaciona as representações (7.36) e (7.37). 


7.6. Um sistema é descrito pela equação de 
diferenças: 


y(k) = —Ory(k—1) -Ooy(k—2) +O3u(k—3). 


Forneça a representação em espaço de esta- 
dos usando a forma companheira controlável. 


7.7. Verifique a a forma companheira obser- 
vável em (7.36) é obtida definindo-se as va- 
riáveis de estado como x;(k) = x; (k + 1) + 
Ani iy(k) — ba-i-iu(k) para i = 1,2,...n. 


7.8. Mostre que a função de transferência 
de um sistema S é invariante com respeito a 
transformações de similaridade de represen- 
tações de S em espaço de estados. 


7.9. Utilize (7.44) e as matrizes do Exem- 
plo 7.1.1 para obter a função de transferência 
daquele sistema. Note que o vetor de entra- 
das em (7.8) refere-se à mesma entrada, mas 
em instantes diferentes. Obtenha também a 
função de transferência aplicando a transfor- 
mada Z diretamente à equação de diferenças 
inicial. Compare os resultados. 


7.10. Para um sistema em tempo discreto 
SISO representado em espaço de estados com 
matrizes (A, B,C), os parâmetros de Markov 
dados por him = CAP mm 12 
são os valores da resposta ao impulso. Par- 
tindo da Eg. 7.51, mostre que H(z) é de fato 
a função de transferência do sistema, ou seja 


H(2) = Y (2) /U(2). 


7.11. Um sistema representado em espaço 
de estados tem matrizes (4, B,C) e vetor de 
estado x € IR”. Duas matrizes importantes 
na teoria de sistemas lineares são: 


C = [BAB AB ... AB] 
C 
CA 
CA? 


S 
I 


CAM 


chamadas de matrizes de controlabildiade e 
observabilidade, respectivamente. Seja P uma 
matriz não singular tal que x = Px. Mos- 
tre que as matrizes de controlabilidade e ob- 
servabilidade nas novas coordenadas, É e Ô 
satisfazem: 


C=Pic e ÔÓ=OP. (7110) 


7.12. Mostre que a parte contínua do sistema 
mostrado na Figura 7.18 pode ser represen- 
tado pela seguinte função de transferência: 


0,052 + 0,045 
(2 — 1)(z — 0,905): 


Glol= 


7.13. Siga procedimento análogo ao da Se- 
ção 7.3.1 para derivar a Eq. 7.97. 


7.14. Derive a Eq. 7.97 utilizando a seguinte 
relação 


de4t 


E Herr GA, (7.111) 


7.15. Mostre que a função de transferência 


10 


G(s) = + 


precedida por um segurador de ordem zero, 
pode ser representada em espaço de estados 


em tempo discreto com intervalo de amostra- 
gem T = 0,1 como: 


[e - E fem 0 sim [MO 


Eli) 0 0,9050 | x>(k) | + [0,9520 
ul = [0] En: (7112) 


7.16. Mostre que o ramo direto do sistema 
mostrado na Figura 7.18 com D(z) = (22 — 
2)/ze G(s) = 1/(s+1) pode ser representado 
em espaço de estados como (Phillips e Troy 
Nagle, 1995, p. 151) 


po + a [o a E Ro e(k) 


vã) = 0) [50]. 


7.17. Determine as matrizes A e B do Exer- 
cício 7.15 utilizando as expansões em série 
(7.64) e (7.65). Quantos termos dessas séries 
precisam ser utilizados para que o resultado 
tenha a precisão de quatro casas decimais? 


7.18. Seja um sistema monovariável com fun- 
ção de transferência 


Do baia" bacoz 2 +. bz +bo 


Y(z 
cl) = la 
U(z) 2" +anaz"I+...az+ao 


Represente esse sistema em espaço de es- 
tados (4, B,C, D) na forma canônica com- 
panheira observável. Indique a dimensão de 
todos os componentes (e.g. vetores, matrizes, 
variáveis). Escreva a equação cujas raízes são 
os autovalores da matriz 4. 


7.19. Seja um sistema monovariável com fun- 
ção de transferência 
Y(z) 2+1 
G(z) = = ablga dio 
O e ng (CS) 
Represente esse sistema em espaço de es- 
tados (4, B,C, D) na forma canônica de Jor- 
dan. Seja o sistema da Figura 7.21, em que 
G(z) é dada em (7.113) e 
(1-el)z 


HO= stress (14) 


Forneça as matrizes da representação em es- 
paço de estados do sistema completo mos- 
trado na Figura 7.21. 


FIGURA 7.21: Sistema de controle em tempo 
discreto. 


7.20. Seja o sistema mostrado na Figura 7.22. 
Represente esse sistema em espaço de estados 
(A, B,C,D). Obtenha a matriz de transfe- 
rência G(z) para esse sistema. Dica: para 
encontrar G(z), note que o sistema pode ser 
particionado de tal maneira que não é neces- 
sário inverter matrizes com dimensão supe- 
rior a 2. 


FIGURA 7.22: Diagrama de fluxo de sinal de 
sistema em tempo discreto. 


7.21. Mostre que as formas companheiras 
controlável e observável de um mesmo sis- 
tema tem a mesma equação característica, e 
que ela pode ser obtida por inspeção em cada 
caso. (Essa é a razão de se usar o termo com- 
panheira). 


7.22. Seja o sistema dado em espaço de es- 
tados 
a(k+1) 04 01 -0,2][ «(k) 0,2 
E pe ] [Dº 08 0,6 | co E | 0,3 | u(k) 
a(k + 1) 15 -0,5 10 || es(k)] [-0,2 


ylk) = [63 12 55J]o(k). (7.115) 


Simule esse sistema para uma entrada em de- 
grau unitário atrasada de cinco intervalos de 
amostragem, ou seja, u(k) = 1(k — 5) para 
k = 1,2,...,100, a partir de condições inici- 
ais nulas. Para isso i) use o comando dlsim 
ou equivalente, e ii) itere as equações em 
(7.115) dentro de um laço for. Compare os 
resultados. 


7.23. Seja o sistema dado em espaço de es- 


tados 
ri(k+1) 0,08 0,01 0,6] x1(k) 0,18 
ER - | 13 09 08 [ENRRA u(k) 
es(k+1) -09 -0,02 0,3 |laes(k)| |-0,15 
y(k) = [63 12 55]e(k). (7.116) 


Com o auxílio de um computador, determine 
a matriz modal do sistema em (7.116) e re- 


presente o sistema na forma canônica de Jor- 
dan. Simule a resposta ao degrau unitário do 
sistema em (7.116) usando o comando step 
ou equivalente. A partir da forma canônica 
de Jordan, escreva por inspeção as três fun- 
ções de transferência correspondentes aos sub- 
sistemas. Simule cada função de transferên- 
cia à uma entrada em degrau unitário e some- 
as. Compare essa soma à simulação do sis- 
tema na forma dada em (7.116). 


7.24. Seja o sistema mostrado na Figura 7.28, 
com 


m(k) 0,7 y(k) 


FIGURA 7.23: (a) Diagrama de blocos, em 
que o bloco indicado por “Proc.” é dado pelo 
diagrama de fluxo de sinal em (b). 


Forneça a equação de estado e de saída, 
indicando o valor de cada elemento de cada 
matriz para esse sistema (a) em malha aberta 
e (b) em malha fechada. O sistema é estável 
em malha aberta? 


7.25. Seja um sistema cujo diagrama de blo- 
cos em tempo discreto é o mostrado na Fi- 
gura 7.24, com 


2z+ 0,3 


Glo)==5 > Ei 
(= 2405 


m(k) = 0,8m(k— 1) +0,5e(k). 


FIGURA 7.24: Diagrama de blocos do Exer- 
cício 7.25. 


Represente o sistema em espaço de esta- 
dos e simule tal representação para uma refe- 
rência em degrau unitário. Simule o mesmo 


sistema de outra forma: como a intercone- 
xão de subsistemas, conforme indicado na Fi- 
gura 7.24. Para isso, obtenha equações de di- 
ferenças usando as funções de transferência, 
e use essas equações na simulação. 


7.26. Verifique as matrizes do pêndulo in- 
vertido fornecidas em (7.108). Simule o pên- 
dulo para entrada nula e condições iniciais 
(0) = [0 -0,01 0 0,01)”. Usando um tempo 
de amostragem de T = 0,05 encontre o mo- 
delo em espaço de estados em tempo discreto 
e simule a mesma situação anterior. Com- 
pare e comente os resultados de simulação. 


Capítulo 8 


Alocação de Polos 
e Estimação de 
Estados 


No Capítulo 5 estudamos o efeito de rea- 
limentar a saída do sistema. Vimos que 
ao fazê-lo parâmetros do sistema em malha 
aberta afetam a localização do sistema em 


malha fechada. Em particular, considere o 
sistema realimentado mostrado na Figura 8.1 
no qual 


FIGURA 8.1: Sistema realimentado em 
tempo discreto. 


O polo de G(z) está em z = p. Ào fe- 
char a malha como indicado na Figura 8.1, 
o número de polos não muda, mas sim a sua 
posição. Os polos são as raízes da equação 
característica, que para esse sistema é: 


1+KG(z) = 0 
2z-p+Kz = 0 
(1+K)z-p = 0, (8.2) 


ou seja, um dos dois coeficientes do polinô- 
mio característico depende do ganho K, que 
pode ser escolhido de maneira a se ter um 
polo em malha fechada na posição z = p/(K+ 
1). A localização possível do polo é restrita. 
Como o sistema é de primeira ordem e como 
polos complexos sempre aparecem em pares 
conjugados, a região viável para o polo é al- 
gum subconjunto do eixo real. Em particu- 
lar, se K = 0, o polo do sistema coincide com 
o polo de G(z), ou seja, em z = p; e à medida 
que K —> o0, o polo vai à origem do plano z, 
que coincide com o zero de G(z). Portanto, 
o lugar das raízes é dez = p a z = 0, como 
esperado. O ponto que se deseja enfatizar 
aqui é que a liberdade de alocação do polo é 
limitada. 

Vejamos o que ocorre no caso de a função 
de transferência da plata ser 


zb 


EC CEC 


(8.3) 


a equação característica é 
2-(p+1-KB)z+p=o0, (8.4) 


em que pode ser visto que K afeta apenas 
um dos dois coeficientes do polinômio carac- 
terístico, e que tal polinômio é mônico (com 
o coeficiente do termo de mais alta potência 
igual a um). Como mostrado pelo método do 
lugar das raízes, estudado no Capítulo 5, as 
raízes da equação característica em tais casos 
ocupam localizações muito específicas e bem 
definidas no plano complexo à medida que 
o parâmetro K varia. Em outras palavras, a 
capacidade de alocação de polos de malha fe- 
chada é bastante restrita, pensando em todo 
o plano complexo como potencial região para 
localização de polos. 

Se mais de um parâmetro fosse ajustá- 
vel seria possível aumentar as regiões viáveis 
para os polos de malha fechada, ou seja, ao 
aumentar a complexidade do controlador — 


permitindo assim variar mais de um parâme- 
tro — é possível colocar os polos de malha fe- 
chada em outros lugares do plano complexo. 
Vemos então que o número de variáveis li- 
vres (parâmetros a determinar) influencia a 
capacidade de alocação de polos. 


É possível aumentar o número de parâ- 
metros do controlador sem aumentar sua or- 
dem dinâmica? A resposta a essa pergunta é 
afirmativa. Se realimentarmos mais de uma 
variável, ainda que o controlador seja pura- 
mente proporcional, teremos um parâmetro a 
determinar para cada variável realimentada. 
Nesse caso, é possível alocar todos os polos 
em posições arbitrárias, supondo que polos 
complexos apareçam sempre em pares conju- 
gados? A resposta para essa pergunta pode 
ser afirmativa ou não, dependendo de uma 
importante propriedade do sistema: sua con- 
trolabilidade. 


Começamos este capítulo com o conceito 


de controlabilidade e seu dual, o conceito de 
observabilidade. A seguir descreve-se um pro- 
cedimento de controle proporcional por re- 
alimentação completa de estados. Em vez 
de realimentar a saída, realimentamos todas 
as variáveis de estado, ou seja, todo o ve- 
tor a E IR”. Como cada elemento de x é 
multiplicado por um ganho diferente, há n 
variáveis livres e, em certas situações, é pos- 
sível escolher a posição dos n polos de malha 
fechada se o sistema for controlável. 


Outro assunto importante estudado neste 
capítulo é o de estimação de estados a par- 
tir dos sinais de entrada e saída do sistema. 
O objetivo é montar um algoritmo, chamado 
observador de estado que, dado um modelo 
do sistema e os sinais de entrada e saída — em 
certas situações —, é capaz de fornecer uma 
estimativa & do vetor de estado, em que o 
chapéu indica que o vetor é estimado. À es- 
timativa & pode, então, ser usada no lugar 


de x em problemas de controle por realimen- 
tação de estados. 


8.1 Controlabilidade e 
Observabilidade 


Os conceitos de controlabilidade e observa- 
bilidade investigados nesta seção foram ori- 
ginalmente propostos por Rudolf Kalman no 
início da década de 60 do século passado (ver 
a Nota Histórica ao final deste capítulo). As 
definições mais antigas são apresentadas na 
próxima subseção, sendo que uma nomencla- 
tura mais moderna é usada depois no con- 
texto de sistemas representados na forma: 


a(k+1) = Ax(k) + Bu(k) 
yulk) = Co(k). (8.5) 


8.1.1 Origem histórica 


Chamando q(t, xo), t > O a solução de um 
sistema dinâmico linear, com condição ini- 
cial xo = a(t), t = 0, a definição de con- 
trolabilidade foi originalmente proposta nos 
seguintes termos: “O estado x de uma planta 
é dito “controlável” se existe um sinal de con- 
trole u(t) definido no intervalo O <t < kt 
tal que d(ti, 2x9) = O. Em geral, o tempo t; 
depende de x9. Se cada estado é controlável, 
a planta é dita 'completamente controlável”” 
(Kalman, 1960, p. 483). Em essência, essa 
definição diz que um sistema completamente 
controlável é aquele que, dada uma condição 
inicial qualquer, existe uma ação de controle 
que, em tempo finito arbitrário, é capaz de le- 
var o estado do sistema a à origem do espaço 
de estados. Em outras palavras, começando 
em x(0) = x, existe um sinal de controle 
tal que x(t1), que é o último valor da tra- 
jetória d(ty, xo), se encontre “na origem” do 


espaço de estados — ou arbitrariamente pró- 
ximo dela —, para t; < oo, sendo ty arbitrário, 
como ilustrado na Figura 8.2. 


FIGURA 8.2: Sob a ação de uma entrada u(t) 
definida em O <t < ty < o, o sistema é 
levado da condição inicial xo à condição final 
a(ti) = 0. Se xo puder ser qualquer, para ti 
arbitrário, o sistema é dito controlável. 


Um conceito relacionado ao de controla- 
bilidade é o de alcançabilidade. Um determi- 


nado estado a(t;) £ O é alcançável se come- 
çando da origem, isto é xo = 0, existe uma 
entrada u(t) definida no intervalo O < t < 
ti < o0 tal que o sistema chegue a a(t;) em 
tempo finito. Se x(t;) puder ser qualquer po- 
sição no espaço de estados, o sistema é dito 
alcançável. O conceito de alcançabilidade e 
controlabilidade são equivalentes para siste- 
mas lineares e invariantes no tempo. Por- 
tanto, tratamos apenas de controlabilidade 
no restante deste livro. 

No caso de observabilidade, diz-se que o 
estado de uma planta é observável se qual- 
quer que seja seu valor inicial x9, o mesmo 
pode ser determinado a partir de medidas do 
sinal de saída y(t) e de entrada (se houver) 
u(t) tomadas durante um intervalo finito de 
tempo O <t < to, (Kalman, 1960). 


Exemplo 8.1.1 


Considere o circuito em ponte mostrado 
na Figura 8.83. 


FIGURA 8.3: Devido à simetria do cir- 
cuito, não é possível, manipulando a 
fonte de tensão u, alterar a tensão sobre 
capacitor, que é a variável de estado do 
circuito. 


Ignorando o capacitor por enquanto, 


o que vemos são dois divisores de tensão 
idênticos. A tensão sobre os resistores 
superiores é u/2 e a tensão sobre os re- 
sistores inferiores também. Tomando o 
terminal negativo da fonte como referên- 
cia elétrica, a tensão na extremidade es- 
querda do capacitor é u/2, que também 
é a tensão na sua extremidade direita, 
qualquer que seja u. Portanto a tensão 
sobre o capacitor é zero. 

Como consequência da topologia do 
circuito, não é possível alterar a tensão 
sobre o capacitor manipulando-se a fonte 
u. Como essa tensão está associada à va- 
riável de estado do circuito, percebemos 
que o mesmo não é controlável. Fazendo 
referência à Figura 8.2, qualquer que seja 
a tensão inicial do capacitor (2x9), não é 
possível encontrar u(t) que descarregue 
o capacitor (tensão final a(t;) = 0V) em 
tempo arbitrário finito. 


8.1.2 Controlabilidade 


Os conceitos de controlabilidade e observabi- 
lidade referidos na Seção 8.1.1 são parecidos 
tanto para o caso de tempo contínuo como 
para o de tempo discreto. A seguir está uma 
definição para o caso discreto, que é utilizada 
para derivar uma forma conveniente de testar 
se um sistema é ou não controlável. 


ÇÃO 
Ri 
[nm] a 


Definição 8.1.1. O par (4,B), 4 € 
R”*”, Be R”*” é controlável se para todo 
Lo € x, existe a sequência de sinais de con- 
trole u(0), u(1), ..., u(N-—1), u(k) € IR” 
para N € Z finito tal que se o estado do sis- 
tema for zo em k = 0, o mesmo é forçado 
pelo sinal de controle para x,y em k < N-—1. 


Portanto, considerando a condição inicial 
e a equação dinâmica, podemos escrever (ver 
Eq. 7.51): 
N-1 
2(N) = APe(0)+5 AV" Bu(n), 
n=0 
que, por sua vez, pode ser escrita como 
[UN] 
ae(N) = ANe(0)+[B AB A2B ... AN-1B] | : | . 
u(0) 
Como o estado no instante N deve ser x, e 


chamando a condição inicial de xo, temos o 
sistema de n equações 


u(N-—1) 
q = ANvo+IB AB A2B ...AN-lB] | : | 


u(0) 


xi AN xo 


u(N-—1) 
[B AB AºB ... AN-1B] | : | » (8.6) 
u(0) 


que deve ter solução para que o sistema seja 
controlável. Deve ser notado que (8.6) é um 


sistema de equações lineares da forma 8 = 
Ca, sendo BER",CERN cae RN. 
Portanto, são n equações lineares simultá- 
neas com Nr incógnitas: u(0), u(l), ..., 
u(N — 1), sendo a matriz C = [B ... AN-IB] 
e o vetor 8 = x, — AN x, conhecidos. 


Se o sistema for controlável, então existe 
uma sequência finita de controle u(k), k = 
0,1,...,N — 1 que leva o estado de xq a x1. 
Em outras palavras, o sistema de equações 
em (8.6) deve ter solução. A seguir analisa- 
remos isso em detalhe. 


Para que o sistema de equações em (8.6) 
tenha solução é necessário e suficiente que a 
matriz [B AB... AN-!B] tenha posto n, ou 
seja, deve ter n colunas linearmente indepen- 
dentes. Como essa matriz tem n linhas, se 
seu posto for n dizemos que tem posto pleno 
de linhas. Escrevemos essa condição como 
pIC] = n, em que pl[:| indica o posto da ma- 
triz. Nesse caso, para todo 8 = 24 — AN'x,, 


há ao menos uma sequência de controle a 
que leva o sistema do estado xo para o es- 
tado x, em tempo finito. Se o número de 
incógnitas for maior que o número de equa- 
ções (Nr > n) — e como pelo teorema de 
Cayley-Hamilton (ver Complemento 8.3) p[C] 
não pode ser maior que n —, nesse caso a solu- 
ção não é única. Se p[C| < n não há solução 
em geral (por exemplo, não existe uma reta 
que passe em três pontos não colineares). 


Para o caso de uma única entrada, tem-se 
be R”,CEIR"". Para que o par (4,b) 
seja controlável, é necessário (e suficiente) 
que p[C] = n, o que requer que N > ne, 
pelo teorema de Cayley-Hamilton, basta que 
N=n. Assim, se p[B AB... ATIB] =n 
existe uma sequência de controle u(0), u(1), 
“o u(n—1) que leva o sistema do estado x 
para x, em n intervalos de amostragem. No 
caso em que há mais de uma entrada, basta 
encontrar n colunas linearmente independen- 


tes em [B AB... AN-1B] para que exista so- 
lução. Nesse caso, existem sequências de con- 
trole que levam o sistema do estado x, para 
x, em menos de n intervalos de amostragem. 
Esse resultado confere com a intuição de que 
é mais fácil controlar um sistema com mais 
entradas independentes. 

Portanto, uma das maneiras de testar se 
um par (4, B) é controlável consiste em for- 
mar a matriz de controlabilidade 


C=[B AB AB ...A"ÍB|EIR"*", (8.7) 


em que r indica o número de entradas, e tes- 
tar seu posto. C deve ter posto pleno de li- 
nhas (p[C] = n) para que o sistema seja con- 
trolável. Ou seja, é necessário que n das nr 
colunas de C sejam linearmente independen- 
tes para que o sistema seja controlável. 

Um importante resultado é que uma trans- 
formação de similaridade não altera o posto 
da matriz de controlabilidade. Em outras 


palavras, um sistema é controlável (ou não 
controlável) independente do sistema de co- 
ordenadas em que seja representado. Esse 
resultado é enunciado mais formalmente na 
Propriedade 8.1.1. 


Propriedade 8.1.1. Seja o par (A,B) e a 
transformação de similaridade definida por 
P tal que (À,B) — (P-/AP, PIB). Se 
jam C e É as matrizes de controlabilidade 
de (A,B) e (À,B), respectivamente. Então 
C = PÊ e plc] = plê). 


Voltemos a considerar o sistema de equa- 
ções (8.6), que está na forma 5 = Ca. Sem 
perda de generalidade, podemos assumir que 
£o = 0 e, portanto, 3 = x,. Note que 8 se 
encontra na imagem de C, ou seja, o estado 
“alvo” x, está no subespaço gerado pelas co- 
lunas da matriz C. Se o sistema é completa- 
mente controlável p[C] = n, ou seja, C tem 
n colunas linearmente independentes que ge- 
ram todo o IR”, x, pode ser escolhido em 


qualquer lugar do espaço de estados. Ao con- 
trário, se p[C|=n — n, n7 > 0, existe um su- 
bespaço não controlável de dimensão m para 
onde o estado do sistema não pode ser le- 
vado por meio das entradas de controle em 
tempo finito. Assim, o subespaço controlá- 
vel, de dimensão p[C], é gerado pelas colunas 
de C, ao passo que o subespaço não controlá- 
vel, de dimensão m, é ortogonal ao subespaço 
controlável. Portanto se p[C| = n, o subes- 
paço controlável é todo o espaço de estados e 
diz-se que o sistema é totalmente controlável. 


Exemplo 8.1.2 


Seja o seguinte sistema em forma compa- 


nheira controlável: 


as (k+1) 0 1 0 a (k) 0 
ER = | 0 0 1 | EM + | u(k) 
gs(k+1) —ao —aj —ag | | vs(k) 1 


a (k) 
y(k) = [bo br bo] | vo(k) | 


va(k) 


A matriz de controlabilidade para esse 
caso é dada por: 


o 1 
c-param= [0 1 —as | 

1 —as —a + ai 
que sendo triangular inferior, tem posto 
pleno, ou seja p[C] = 3. Logo o sistema 
deste exemplo é controlável, como pode- 
ria ser antevisto, pois está representado 
em forma companheira controlável. Deve 
ser notado que a controlabilidade do sis- 
tema independe dos valores dos coeficien- 
tes a;, como argumentado anteriormente 
ao comentar sobre a Figura 7.7. 


Exemplo 8.1.3 


Considere o diagrama de fluxo de si- 
nal mostrado na Figura 8.4 (Luenberger, 
1o7O poor 


u(k) 


FIGURA 8.4: Diagrama de fluxo de sinal 
para o Exemplo 8.1.3. 


Deseja-se determinar a controlabili- 
dade desse sistema. Para isso, começa- 
remos obtendo o par (4,b). Note que 


como o problema em questão é a con- 
trolabilidade, não é necessário definir a 


saída. Ras | 
À equação dinâmica do sistema da Fi- 
gura 8.4 é: 


Es E o 


A matriz de controlabilidade para esse 
caso é dada por: 


1 as 
C=[|b Ab|= E 0 | 
que tem posto p[C] = 1, portanto o sis- 
tema é não controlável. Esse resultado 
era esperado, uma vez que pelo diagrama 
de fluxo de sinal pode ser visto que a en- 
trada u(k) não afeta o estado xo(k). Ge- 
ometricamente isso significa que há re- 
giões no espaço de estado (o subespaço 


não controlável) para onde não é pos- 
sível levar o sistema (o estado x) em 
tempo finito por meio da ação de controle 
u(k). Tomando a, = 0,8 e a = —0,2, 
a matriz de controlabilidade C em (8.7) 
pode ser obtida pelo comando Matlab 
C = etrb(4,b). Como o posto de € é 
um, ou seja, rank(C) = 1, 0 par (4,b) 
não é (totalmente) controlável. 


8.1.3  Observabilidade 


O conceito dual (ver Seção 8.1.4) de contro- 
labilidade é o de observabilidade. 


ne 


[=] sis 


Definição 8.1.2. O par (4,0), 4 € 
RºZ”. O € R?*”, é observável se para qual- 
quer x(0), essa condição inicial pode ser de- 
terminada a partir da sequência finita de va- 
lores da saída y(0), y(1), ..., y(N — 1), 
y(k) E IR?, e de entradas u(0), u(1), ..., 
u(N — 1), u(k) € IR”, para N € Z finito. 


Os valores da saída para o sistema (8.5) 
com condição inicial e(0) = x, e entrada 
nula é 


vy(O) = Ca(0) + Du(0) 

vy(l) = Ca(1) + Du(1) = CAx(0) + CBu(0) + Du(1) 

vy(2) = Ca(2) + Du(2) = C[Ax(1) + Bu(1)] + Du(2) 
= CAtg(0) + CABu(0) + CBu(1) + Du(2) 


N-2 
y(N-1) = CANIo(0)+ 53) CAN 2" Bu(n)+Du(N-1), 
n=0 


que pode ser expresso em forma matricial 


como 


y(0) — Du(0) (0) 
y(1) — CBu(0) — Du(1) CA 
= : a(o), 
y(NA)-SN=2 CAN-2" Bu(n)- Du(N-1)) [CANA 


que está na forma 8 = Oa, sendo 8 € IR?”, 
O e IR?" eae RR”, sendo que Be O 
são conhecidos. Na Eq.8.8 as incógnitas são 
os elementos do vetor x(0) E IR”, ou seja, 
trata-se de um sistema com n incógnitas e Np 
equações. A mesma análise realizada para 
o problema de controlabilidade pode ser re- 
alizada aqui. Assim, é possível determinar 
a(0) unicamente se houver n equações line- 
armente independentes, ou seja, se p[O] = n. 

No caso monovariável (p = 1),0 E IRº*”, 
a condição para o sistema ter solução conti- 
nua sendo p[O] = n. Pelo teorema de Cayley- 
Hamilton sabemos que CAN-1, N > n pode 
ser escrito como uma combinação linear de 
CA”, k = 0,1,n — 1, logo basta considerar- 


mos N =n. Portanto, no caso de haver ape- 
nas uma saída, se o sistema for observável, 
basta conhecer y(k) eu(k), k = 0,1,...,n—1 
para determinar a condição inicial (0). 

A matriz de observabilidade é definida 
por 


O = ERP, (8.9) 
CAM 


eo par (4,C) é observável se e somente se 
pIO] = n. Se p[O] < n significa que o espaço 
nulo de O tem dimensão maior ou igual a um, 
o que implica que 3 = Oa não tem solução 
única. Do ponto de vista prático isso signi- 
fica que a partir do conjunto de medidas em 
/8 — lado esquerdo de (8.8) — não é possível 
distinguir quaisquer dois estados. Dito de ou- 
tra forma, vetores de estado que estejam no 
espaço nulo de O são indistinguíveis a par- 


tir das medições. Essa perda de capacidade 
de distinguir entre certas situações (estados) 
“próximas” a partir de medições é uma con- 
sequência de perda de observabilidade. 

É interessante notar que no caso de ha- 
ver mais de uma saída é possível verificar a 
condição p[O] = n para N < n. Nesse caso, 
é possível determinar a condição inicial a(0) 
usando uma janela de dados menor que n. 
Essa observação é intuitiva, pois se medimos 
mais saídas (linearmente independentes), po- 
demos encontrar a informação desejada me- 
dindo por menos tempo. 


[nl [2] 
Fed 
ES 


Na prática, para um sistema observável 
é possível determinar o estado a partir de 
medições de y(k) e u(k) e do conhecimento 


das matrizes (A, B,C, D), como discutido na 
Seção 8.3. 

À semelhança do que se constatou no caso 
de controlabilidade, o posto da matriz de 
observabilidade de um sistema é invariante 
com respeito a transformações de similari- 
dade, como sintetizado na propriedade a se- 
guir. 


Propriedade 8.1.2. Sejam O ce Ô as ma- 
trizes de observabilidade dos pares (A,C) e 
(A, 0), respectivamente. A transformação de 
similaridade definida por P é tal Ei (A,O) = 
(PAP,CP). Então O = ÓP-! e p[O] = 
plo). 


Exemplo 8.1.4 


Seja o sistema (Phillips e Troy Nagle, 


1995, p. 368) 


Ea pe eso 
u(h) = [=1 01 ]a(h) +u(h), (8.10) 


para o qual se deseja investigar a contro- 
labilidade e a observabilidade. A matriz 
de controlabilidade desse sistema é: 


c=[pAm=|1 o: (8.11) 


cujo posto é um, pois as duas colunas 
são linearmente dependentes. Neste caso 
é fácil ver que C tem duas colunas idên- 
ticas. Portanto, o sistema não é total- 
mente controlável. De fato, como vere- 
mos em breve, um dos modos do sistema 
não é controlável, ao passo que o outro 
sim. Para avaliar a observabilidade, cal- 


culamos 


eu —1 1 
a EM E E e Jeni, 


que também tem posto unitário, indicando 
que um dos modos do sistema não apa- 
rece na saída. Lembre-se que c é o vetor 
coluna, portanto c” = [—-1 1). A matriz 
em (8.12) pode ser obtida usando o co- 
mando Matlab O = obsv(A, c”). 

A fim de verificarmos qual modo é ob- 
servável e qual é controlável, um procedi- 
mento útil é colocar o sistema na forma 
canônica de Jordan, pois ela representa o 
sistema de forma desacoplada. Para isso 
é necessário realizar uma transformação 
de similaridade usando a matriz modal 
composta pelos autovalores da matriz A 


em (8.10). Neste caso tal matriz é: 


0 0,707 
M = E E (8.13) 


- As matrizes na nova representação são 
A = Ni ANDES = Mo Bo C=QMe 
D = D (ver Eq. 7.13). Portanto, o sis- 


tema nas novas coordenadas é represen- 
tado como: 


[td] = [8 coa) [26] +[ iu] 
u(k) = [10 ]a(h) +u(h). (8.14) 


A representação em (8.14) está na 
forma canônica de Jordan, em que 4 é 
uma matriz diagonal com os autovalo- 
res mostrados explicitamente. Lembre-se 
que essa estrutura da matriz A é garan- 
tida quando os autovalores forem reais e 
distintos. Assim, vemos que o sistema 
tem dois modos: 0,8* e (—0,2)*. Note 


que a entrada u(k) não atinge o modo 
gerado pelo autovalor em z = 0,8, por- 
tanto esse modo é não controlável. Por 
outro lado, o modo gerado pelo autovalor 
z = —0,2 é afetado pela entrada sendo, 
assim, controlável. Uma análise equiva- 
lente pode ser feita com respeito à pre- 
sença dos modos na saída. Pela estrutura 
do par (À, é), pode-se ver que o modo 
0,8* aparece na saída e, portanto, é ob- 
servável, o que não ocorre com o modo 
(—0,2)*. Portanto, não deve ser sur- 
presa que o sistema deste exemplo tenha 
função de transferência nula (ver Exercí- 


cio 8.4). 


No Exemplo 8.1.4 o modo não controlá- 
vel é estável. Isso significa que ainda que esse 
modo não possa ser mudado, ele não levará o 
sistema à um comportamento instável. Sis- 
temas não controláveis cujos modos instáveis 


são controláveis são chamados de sistemas es- 
tabilizáveis. Semelhantemente, se todos os 
modos instáveis de um sistema forem obser- 
váveis, o sistema é dito detectável. 


8.1.4 Dualidade 


Seja o sistema 


a(k+1) = Ax(k) + Bu(k) 
y(k) = Ca(k) + Du(k), (8.15) 


com matrizes AE RS”, BEIR, Ce 
RP” e D € RP*”, e vetores x € R”, u € 
IR" ey e IR?. Transpondo-se as matrizes, 
invertendo a posição de B e €, e trocando 
entre si as dimensões dos vetores de entrada 
e saída, obtém-se o sistema dual de (8.15): 


Z(k+1) = AT&(k) + CTa(k) 
w(k) = Bra(k) + D'a(k)(8.16) 


com matrizes AT E IR"*”, CTEIR"*?, BT € 
R'*” e DT E IR'*?,e vetores £Z e IR”, à € 
RºeyelR”. 

A matriz de a controlabilidade do sistema 
(8.15) é (ver Eq. 8.7): 


C=[BAB AB... ATÍB] 


e a condição para que o sistema seja contro- 
lável é que p[C| = n. A matriz de observabi- 
lidade para o sistema dual (8.16) é 

BT 
BTAT 


Oq = (8.17) 


el alia 
sendo que a condição de observabilidade é 
plOa] = n. Como p[O4] = p[OZ], transpondo 


a matriz de observabilidade do sistema dual 
temos 


OE es IÇBE RR BRÇAR 
[BAB «sA BI, (8.18) 


que é a matriz de controlabilidade do sistema 
original. Portanto C = O4 e seguindo um 
procedimento análogo é possível mostrar que 
O = Ci (ver Exercício 8.5). Como a trans- 
posição não altera o posto da matriz, tem-se 
os seguintes resultados. 


Teorema 8.1.1. O par (4, B) é controlável 
se e somente se o par (A”, BT?) for observá- 
vel. 


Teorema 8.1.2. O par (4,C) é observável 
se e somente se o par (AT, CT) for controlá- 
vel. 


Para ilustrar o uso do Teorema 8.1.2, 
considere que se tenha uma função de com- 
putador para testar controlabilidade do par 
(A, B), mas se deseja testar a observabili- 
dade de (4, C). Nesse caso, basta usar a re- 
ferida função para testar a controlabilidade 
de (A”,C”). Se o resultado for que esse par 


(dual) é controlável, então o par (4,C) é ob- 
servável. 


Exemplo 8.1.5 
Seja o sistema 
mi(k4A 0,8 1 z 
E] E 0 a É 
y(k) = [0 1]a(k)+u 


O comando Matlab € = ctrb(4,b) 
retorna a matriz de controlabilidade: 


0 1,4140 
1,4140 —0,2828 |” 


que é o mesmo resultado obtido com o co- 
mando OT = obsv(A',b)'. O par (4,b) 
é controlável, pois C, e consequentemente 
Oa têm posto pleno. 

Semelhantemente, a matriz de obser- 


vabilidade 

ia! 

0 —0,2 |' 
pode ser obtida fazendo O = 
obsv(4,c"), em que ce” = [0 1] ou 


calculando o transposto da matriz de 
controlabilidade para o sistema dual, ou 
Seja Cc ctrb( AD e par pd el) 
é não observável. 


Exemplo 8.1.6 


Consideramos o sistema (7.49) investi- 


gado no Exemplo 7.2.7, que está na forma 
companheira controlável. Portanto, o par 
(A,b) é controlável, com 


od 
E E 


mas que não é observável, uma vez que 
O = obsv(A,c”) é: 


5 —25 
0=|; E 


A controlabilidade da representação 
usada em (7.49) não é surpresa, pois isso 
é garantido por construção da forma com- 
panheira controlável. Mas como a função 
de transferência correspondente tem um 
cancelamento de polo e zero, ou seja, os 
polinômios do numerador e do denomina- 
dor têm fatores em comum (não são co- 


primos), a falta de observabilidade tam- 


bém não é surpresa. 
Prossigamos a análise representando 
o sistema em forma companheira obser- 


vável (7.37): 


pe 


u(k) 


II 
S 
[o 
E 
8 
A 
EM 
+ BB 
E 
Es 
a 
> 
-» 
o 
o) 
= 
SS» 


que, por construção é observável, mas não 
é controlável. Um aspecto interessante a 
observar é que a forma companheira ob- 
servável em (8.20) é a representação dual 
da forma companheira controlável (7.49). 


De forma geral, um sistema que seja 
a realização de uma função de transfe- 
rência com polinômios coprimos, ou seja, 
em que não há fatores comuns (e por- 
tanto não há cancelamento de polos e 
zeros), pode ser representada na forma 


companheira controlável que, nesse caso, 
também é observável; ou pode ser ex- 
pressa na forma companheira observável 
que, nesse caso, também é controlável. 
Contudo, se houver cancelamento de po- 
los e zeros, como neste exemplo, a repre- 
sentação escolhida não pode ser simulta- 
neamente controlável e observável. 

O leitor deve notar que a aparente 
“opção” entre ser controlável ou observá- 
vel no presente exemplo advém do fato de 
se tratar de um problema de realização 
de uma função de transferência em que 
há cancelamento de polo e zero. Se, ao 
contrário, as equações de estado tiverem 
surgido da modelagem física do sistema, 
então o par (4,b) seria não controlável, 
caso o sistema fosse não controlável. O 
mesmo pode ser dito sobre a observabili- 
dade do sistema e do par (4, c”) do mo- 
delo correspondente. 


8.2 Realimentação de 
Variáveis de Estado 
Nesta seção discutimos a alocação de polos 


por realimentação de variáveis de estado, ou 
simplesmente realimentação de estado. 


Considere um sistema com x E R” e 
matriz 4 € IR"X?. A matriz À tem n au- 
tovalores que, em princípio, são os n polos 
do sistema. Como visto na Seção 7.1.2 e no 
Exemplo 7.2.7, se o sistema não for controlá- 
vel ou observável, nem todos os autovalores 
de 4 são polos do sistema. Aqui, considera- 
mos que os n autovalores de A são os polos 
do sistema, ou seja, o sistema é controlável 


e observável. Sabemos que esses autovalo- 
res determinam as características dinâmicas 
do sistema. Por exemplo, se os autovalores 
de um sistema estável estão muito próximos 
ao ponto z = 1 no plano complexo z, a di- 
nâmica do sistema é lenta e se alguns deles 
forem complexos conjugados, a resposta do 
sistema é oscilatória. 


A fim de melhorar a dinâmica do sistema 
e adequá-la aos requisitos de operação é co- 
mum pensarmos no projeto de um sistema 
de controle, digamos, como o mostrado na 
Figura 8.1. Como visto na introdução, esse 
sistema realimentado tem a capacidade de al- 
terar a localização dos polos do sistema con- 
trolado e, portanto, tem o potencial de mu- 
dar a dinâmica de malha aberta. Mas, como 
discutido, a capacidade de alocar os polos 
do sistema depende do número de parâme- 
tros do controlador. Para aumentar o nú- 
mero de parâmetros e assim ganhar capa- 


cidade de alocar polos em malha fechada é 
possível aumentar a complexidade do con- 
trolador usando, por exemplo, uma função 
de transferência em vez de apenas um ga- 
nho escalar. Ao fazer isso, o número de polos 
da malha fechada aumenta também e, con- 
sequentemente a disponibilidade de parâme- 
tros livres. 


Seja u(k) = r(k) — kric(k), em que k, E IR 
é uma constante. Essa lei de controle é do 
tipo proporcional, com realimentação nega- 
tiva da saída, como mostrado na Figura 8.1 
e, como discutido na introdução, podemos es- 
colher kj de modo a colocar o polo de ma- 
lha fechada em um trecho do eixo real. Se 
o sistema é de ordem n > 1 o uso de k; é 
insuficiente para alocar todos os polos arbi- 
trariamente no plano complexo. 


Uma solução elegante para esse problema 
pode ser obtida no contexto da representação 
em espaço de estados. Para vermos isso, vol- 


tamos a considerar o sistema de primeira or- 
dem e, sem perda de generalidade, definimos 
a única variável de estado desse sistema como 
sendo a saída. Portanto a lei de controle pode 
ser escrita como u(k) = r(k) — kixi(k), que 
só tem um parâmetro livre kj. Agora se o 
sistema for de ordem n, podemos generalizar 
essa lei de controle para 


=r(k) — Ka(k), (8.21) 
em que K = [kj ko ...kn|. Usando a lei de 
controle (8.21) na equação dinâmica resulta 


em: 


a(k+1) 


Ax(k)+bIr(k) — Ka(k)] 
= (A-bK)ax(k)-+br(k), (8.22) 


que juntamente com a equação de saída y = 
Ca passa a descrever o sistema sob a ação 


da lei de controle (8.21). A equação caracte- 
rística do sistema realimentado é dada por: 


I-(A-bHO|=O, (8.23) 


sendo A(z) = |21—-(A-—bK)| o polinômio ca- 
racterístico. Deve-se determinar o vetor (li- 
nha) de ganho K de tal forma que A(z) seja 
igual a um polinômio característico desejado 
e, portanto, conhecido. É conveniente ob- 
ter o polinômio característico por inspeção, 
o que é possível se o sistema estiver repre- 
sentado na forma companheira controlável, 
mostrada na Eq. 7.28. Nesse caso, podemos 
escrever, 


O 0 0 0 
O 00... 0 
bK =| Li (8.24) 
O 00... 0 
ki ko ks kn 


e, portanto, a matriz dinâmica do sistema 


realimentado também está em forma compa- 
nheira e é: 


0 1 0 st 0 
0 0 1 als 0 
A-bK= E l l 7 É 
0 0 0 e 1 

(ao+k1) —(ar+k>) —(az+k3) ... —anatkn) 


cujo polinômio característico, que pode ser 
obtido por inspeção, é (compare a Eq. 7.23 e 
a Eq. 7.28): 
AM=3" +ancitkn)A" TI +... +(a1 +ko)A+(ag+k1)(8.25) 
Agora suponha que o polinômio caracte- 
rístico desejado para o sistema em malha fe- 
chada (lembre-se que desejamos alocar polos 
em lugares pre-especificados via realimenta- 
ção de estado) seja: 


Aa(M)=1"+ana ATI +... +aA+ao(8.26) 


Comparando, termo a termo, os polinômios 
característicos das equações 8.25 e 8.26 po- 
demos escrever: 


ki =0w—a1i=0,1, cn—l, (8.27) 


o que finaliza o projeto. 


A facilidade de calcular os coeficientes da 
matriz de ganho como indicado em (8.27) é 
devida ao fato de o par (4,b) estar na forma 
canônica controlável. Esse fato foi utilizado 
por Kalman em 1963 para mostrar um teo- 
rema originalmente proposto por J. E. Ber- 
tram em 1959, que estabelece que se o par 
(A, b) for completamente controlável (ver Se- 
ção 8.1) existe um vetor K tal que os autova- 
lores de (A— bK) podem ser arbitrariamente 
escolhidos (Kalman et al., 1969, p. 49). 


Suponha que se deseje encontrar K para 
um sistema (4,b,c”) que não esteja nessa 
forma canônica. Em princípio um procedi- 
mento é usar uma transformação de similari- 
dade apropriada x = Pá de tal maneira que 
o sistema no novo conjunto de coordenadas 
(À,b, €”) esteja na forma companheira con- 
trolável. Nesse caso, dado Aa(A), o procedi- 
mento acima pode ser usado para encontrar 


o vetor (linha) de ganho K, que deve ser ex- 
presso nas coordenadas originais fazendo-se 
dad! a 

Mas como determinar P? É possível mos- 
trar que C€ = PÉ, portanto P= CÊ-1, Pl = 
CC-1, em que É é a matriz de controlabili- 
dade do par (À,b) e C é a matriz de contro- 
labilidade do par (4,b), e p[C] = pI] = n. 
Ilustraremos essas relações no próximo exem- 
plo. 


Exemplo 8.2.1 
Seja o par (4, b) 


EL “To5 
a= [0 ae) d=[) 


para o qual a matriz de controlabilidade 


e a 
c=p4m= [09 08]. 


que tem posto p|C| = 2. Os autovalores 
da matriz 4 são A =-—-1,2e A =-—0,8, 
que aparecem na diagonal principal de 4, 
porque tal matriz é triangular. Portanto, 
o polinômio característico é 


A(A) = (A+LZ(A+0,8) = A2+21+0,96, 


e, logo, o par (4, b) pode ser expresso em 
forma companheira controlável como 


1 0 il = 0 
Ra E = [1]. 


Deve ser notado que se o objetivo é 
encontrar a representação (4, b) já tería- 


mos o resultado. Mas a fim obter a ma- 
triz P e verificar a expressão P = CCI, 
determinamos a matriz de controlabili- 
dade do par (4,b) como 


C=[bAB=| o, 


Portanto 


Domo | Ub OA ER Po dons 
Nero =[ SE = a 


Fica como exercício verificar que À= 
REAR D = Rb: 


Uma consequência das relações P = CC 
e P1 = CC é que para que exista a dese- 
jada transformação de similaridade descrita 
por P, é necessário que o sistema seja con- 
trolável, pois se não o for, as matrizes C e 
C não têm inversa e P não é definida. Ou 
seja, um sistema não controlável não pode 


ser colocado na forma companheira controlá- 
vel, como seria de se esperar. 

É possível determinar K sem supor que 
(A, b) esteja em forma companheira contro- 
lável e sem a necessidade de encontrar uma 
outra representação, como (À, b) acima. Na 
próxima seção é visto que mesmo assim a 
condição para sermos capazes de alocar li- 
vremente todos os autovalores do sistema re- 
alimentado é que o sistema seja totalmente 
controlável, ou seja, p[C] = n. 


8.2.1 A fórmula de Ackermann 


Se o sistema a ser controlado com u(k) = 
r(k) — Ka(k) não estiver representado na 
forma companheira controlável, o vetor (li- 
nha) de ganho K pode ser determinado utili 
zando a fórmula de Ackermann (Ackermann, 


1972): 


K = [00...01]b Ab 42b ...Aº-Ib TAG(A) 
= [00 ...01]CiAG(A) (8.28) 


sendo que o vetor linha [0 0 ...0 1] tem n 
elementos, Aqa(A) é o polinômio característico 
desejado para a malha fechada (ver Eq. 8.26) 
avaliado em 4 € R"*”, ou seja, 


AA) =A" tan dA IL... tayAtagi. (8.29) 


Note que Aa(A4) E IR"*”. Um aspecto im- 
portante sobre o uso de (8.28) é a necessi- 
dade de a matriz de controlabilidade C ser 
não singular, ou seja, o par (4,b) deve ser 
controlável. Portanto, em um sistema con- 
trolável é possível alocar todos seus polos por 
realimentação de estados. 

Uma maneira de obter a fórmula de Aker- 
mann (8.28) é seguindo o procedimento men- 
cionado na seção anterior que usa a trans- 
formação de singularidade definida por P = 
cê, p1 — Êc- (ver Exercício 7.11 e 
Eq. 7.110). Os detalhes de sua derivação po- 
dem ser encontrados em (Ástrôm e Witten- 
mark, 1990, pp. 247,248). Uma outra deri- 


vação da fórmula de Ackermann pode ser en- 
contrada em (Ogata, 1995, pp. 408-410). 
Note que a fórmula de Ackermann só se 
aplica ao caso de uma entrada. No caso em 
que há r entradas, a matriz K tem dimen- 
são r xn, ou seja, há rn parâmetros livres 
para alocar somente n polos. Isso indica que 
existem infinitas soluções para o problema 
de alocação de polos. As incógnitas em ex- 
cesso podem, em princípio, ser usadas para 
alcançar outros objetivos de controle. Essa 
foi uma das motivações para uma família de 
métodos de controle que veio a ser conhecida 
como controle ótimo (ver Complemento 8.5). 


Exemplo 8.2.2 


Neste exemplo ilustramos o uso da fór- 
mula de Ackermann em (8.28). Consi- 
dere o sistema 


esta] = [8º 3) [888] 1t8) = 
Os autovalores da matriz 4 são À = 
—1,2e À» = —0,8 e, portanto, o sistema 
é instável. Deseja-se encontrar um vetor 
linha de ganho K tal que o sistema em 
malha fechada, sob a ação da lei de con- 
trole u(k) = —Ka(k) tenha autovalores 
em À = 0,9e A = 0,8. 

O primeiro passo é verificar se o sis- 


tema é controlável. O posto da matriz de 
controlabilidade 


c=[bAb= E o | (8.30) 


é dois, e portanto é possível alocar os 
polos por realimentação de estados. O 
polinômio característico para o sistema 
controlado é 


NAO = (= MO) == ANAL: 


Portanto, tem-se que 


2] 
= dl Sp 10 
Godi 0 na] = 0 “Os [rom Ê | 


ERP 
a i diairo | E) 


Por fim, o vetor de ganhos é dado por 
(8.28) 


a [OEA A) 


=t01)[05 04 EE Ro, 
5 NE: pila 
= [5,2500 — 6,3250]. (8.32) 


Fica como exercício verificar que (A— 
bK) tem os autovalores desejados. No 
Matlab a função acker implementa a fór- 
mula de Ackermann. Também, a função 
place pode ser usada para encontrar K. 
acker só se aplica ao caso monovariá- 
vel, mas aceita polos com multiplicidade 
maior que um. place tem propriedades 
numéricas melhores, pode ser usada no 
caso multivariável, mas não aceita polos 
com multiplicidade maior que o número 
de entradas. 

O código a seguir pode ser usado para 
determinar K neste exemplo 


% matrizes do sistema 
A=[-1.2 1;0 -0.8]; 
b=[0.5;1]; 


% matriz de controlabilidade 

Cont=[b Ax+b] 

4% posto da matriz de controlabilidade 
rank (Cont) 


4% polinomio caracteristico desejado 
p=[1 -1.7 0.72]; 

4% polos de malha fechada desejados 
roots(p) 


4% Delta(A) (8.31) 
DeltaA=p(1)+*A*A+p(2)*A+p(3) *eye(2) 


% formula de Ackerman (8.28) 
K=[0 1]xinv(Cont)+*DeltaA 


% nova matriz em malha fechada 

Atilde=A-b+*kK 

% autovalores da matriz "A"em malha fechada 
eig(Atilde) 


% usando a funcao acker 
Ka=acker(A,b,roots(p)) 


4% usando a funcao place 
Kp=place(A,b,roots(p)) 


8.2.2 Função de transferência de 
malha fechada 


Nesta subseção deseja-se encontrar a repre- 
sentação em função de transferência para o 
sistema em malha fechada quando u(k) = 
Nr(k) — Ka(k), para o caso monovariável 
(ver Exercício 8.6). 

Antes de derivar a função de transferên- 
cia em malha fechada, devemos considerar 
alguns aspectos a respeito da lei de controle. 
Se essa lei for simplesmente u(k) = —Ka(k), 
o sistema em malha fechada é: 


c(k+D)=(A-bK)a(k), (8.33) 


no caso monovariável. Assumindo que K foi 
determinado de maneira que o sistema em 
(8.33) seja assintoticamente estável, a solu- 
ção em estado estacionário é & = 0, em que 
usamos % = limpo 2 (k), assumindo que o 
limite existe e é finito. Portanto, (8.33) em 


estado estacionário resulta em x = (A — 
bK)z. Como (A — bK) não é identidade, 
a única solução possível é a trivial, ou seja, 
=; 

Ao utilizar a lei de controle u(k) = 
—Ka(k), o sistema em malha fechada 
tornou-se autônomo, ou seja, independe de 
um sinal externo dependente do tempo. A 
fim de estabilizar o sistema em algum ponto 
fora da origem do espaço de estados, esco- 
lhemos u(k) = Nr(k) — Ka(k). Com essa 
lei de controle, o sistema controlado pode ser 
escrito como: 


e(k+1) = (A-bK)x(k)+bNr(k) (8.34) 


que é não autônomo, por depender do sinal 
externo r(k) que é uma função do “tempo 
discreto” k. Agora, em estado estacionário 
tem-se: 


8 
| 


= (A- bK)z + bNr(k) 
(I-A+bK)z = bNr(k) 
2x = (I-A+bK)IbNr(k), (8.35) 


ou seja, o sistema controlado pode agora ser 
estabilizado em pontos do espaço de estados 
que não a origem, dados por (8.35). Além 
disso, tais estados de equilíbrio dependem do 
sinal de referência r(k) e do parâmetro N, a 
ser determinado pelo projetista. A utilidade 
disso é considerada depois. 


Passando agora à determinação da função 
de transferência, do sistema controlado, dado 
pela equação dinâmica (8.34) e a equação de 
saída y(k) = cTa(k), aplicamos a transfor- 
mada Z considerando condições iniciais nu- 
las, para obter 


2X(2)=(A-bK)X(2) + bNR(2) 
Fi) =e"X(2): (8.36) 


Seguindo procedimento parecido ao usado 
para obter (8.35) na primeira equação de 
(8.36) e substituindo na segunda equação, 


chega-se a: 


X(2)=(21-4+bK) !bBNR(2) 


Y(2) = e! Zl— il: 
RO)” (2I-A+bK) IBN, (8.37) 


que é a função de transferência da malha fe- 
chada. O ganho CC da malha, dado por 
Y(1)/R(1), pode ser ajustado por meio de 
N, como ilustrado no próximo exemplo. 


Exemplo 8.2.3 


Voltamos a considerar o sistema proje- 
tado no Exemplo 8.2.2, em que u(k) = 
—Ka(k). Usemos, por enquanto, u(k) = 

r(k) — Ka(k), ou seja, é como se tivés- 


semos escolhido N = 1. Nesse caso a 
unção de transferência do sistema con- 


trolado é 


= 
E Ei [5,2500 — 6,3250] Ea 


—1 
= z+3,8250  —4,1625 0,5 
a 5,2500 2 — 5,5250 | 1 | 


ig] 1 z—5,5250 4,1625 ][0,5 
Cl -1,72+0,72 | —5,2500 z+3,8250| | 1 
1,252 + 1,9 


NT 


em que se usou c” = [0,5 1]. O ganho 
em estado estacionário do sistema con- 
trolado é Y(1)/R(1) = 157,5. Se dese- 
jarmos que esse sistema tenha erro nulo 
em estado estacionário para uma entrada 
em degrau, devemos ter Y (1)/R(1) = 1. 
Portanto, tomando N = 1/157,5, a lei de 
controle u(k) = Nr(k) — Ka(k) alcança 
esse objetivo, como mostrado no código 
a seguir: 


) este código é continuação 

% daquele do Exemplo 8.2.2 

% inicialização do “vetor” de estado 
x=zeros (2,200); 


% condição inicial do sistema 
x(:,1)=[1;-1]; 
y(1)=Cax(:,1); 


4% referência 
r=[zeros(100,1);ones(100,1)]; 

% ganho para garantir rastreamento 
N=1/157.5; 


% simula o sistema controlado 
for k=1:200 
% lei de controle 
u(k)=N+r(k)-Kex(:,k); 


% equação dinâmica 
x(:,k+1)=A+x(:,k)+B+xu(k); 


% equação de saída 
y(k+1)=Cax(:,k+1); 
end; 


O ponto fraco da presente abordagem 
para atingir o rastreamento do degrau é 
que qualquer erro no modelo afeta o re- 


sultado, pois o valor de N determinado 
será diferente daquele requerido. Uma 
melhor maneira de resolver esse problema 
é inserir integração no controlador, como 
visto na Seção 8.2.4. 


8.2.3 Lei de controle em 
função do erro 


A seguir desejamos escrever a lei de controle 
em função do erro entre a referência e saída, 
quando esta for um dos estados do sistema. 
Sem perda de generalidade assumimos que a 
variável de estado medida é a primeira, ou 
seja, y(k) = x1(k). Como a lei de controle é 


[28] 
xo (k) 
u(k) = Nr(k) — [ky ko» ct] | 


= Nr(k)-kiwi(k)—koxo(k)...—knun(k) (8.38) 


e como y(k) = x1(k), para que u(k) fique em 
termos do erro basta escolher N = k,. Assim 


u(k) = kalr(k) — y(k)] — koxo(k)... — knxn(k) 
= kre(k) — koxa(k)...— kntn(k), (8.39) 


em que e(k) = r(k)—y(k). Esse esquema está 
mostrado na Figura 8.5. No próximo exem- 
plo, mostramos como encontrar o estado es- 
tacionário desse sistema, caso convirja. 


Exemplo 8.2.4 


Voltamos a considerar o problema tra- 
tado no Exemplo 8.2.2. Desejamos utili- 
zar o ganho K obtido e colocar o sistema 
como mostrado na Figura 8.5 e determi- 
nar o estado estacionário supondo que a 
referência é um degrau unitário. 


Sistema & 


Modelo M : (A, B,C) 


FIGURA 8.5: Diagrama de blocos do sis- 
tema em malha fechada usando a lei de 
controle (8.39). 


Para fazer análise em estado estaci- 
onário supõe-se que x(k +i) = & Vi se 
o sistema convergir. Semelhantemente, 
usamos à barra superior para indicar o 
valor em estado estacionário de todas as 
variáveis. Vimos que tomando N = kj 
quando a saída é a primeira variável de 
estado, chega-se à lei de controle u(k) = 
kilr(k)—y(k)|—kox>(k). Portanto, usando 


N = 5,250 e o valor de K obtido no 
Exemplo 8.2.2 er = 1 em (8.35) chega-se 
a: 


2 = | 198,75 
= ar so | 


O valor da saída em estado estacionário 
é dado por y = % = 498,75. Logo, a 
lei de controle utilizada, apesar de alocar 
os polos onde desejado, não permite ras- 
trear o degrau com erro nulo em estado 
estacionário. Isso pode ser resolvido por 
meio de integração. 


8.2.4 Lei de controle com 
integração 
Dos resultados obtidos na primeira parte deste 


livro em que foram usadas as ferramentas 
de transformadas, sabemos que uma maneira 


mais robusta de garantir erro em estado es- 
tacionário nulo para entradas em degrau é 
fazer com que a função de transferência de 
malha seja tipo 1. Quando a planta é tipo 1, 
basta usar um controlador proporcional. Por 
outro lado, se a planta for tipo 0, incluímos 
ação integral na lei de controle. Nesta seção 
usamos esse fato para obter erro nulo em es- 
tado estacionário para entradas em degrau, 
mas no contexto da representação em espaço 
de estados. Para isso seguimos dois procedi- 
mentos, o primeiro deles é descrito a seguir. 


Planta tipo 1 e controlador proporcio- 
nal. Aqui o objetivo é fazer o projeto em 
duas etapas. Na primeira, usamos a lei de 
controle u(k) = uj(k) — Ka(k), conforme 
indicado na Figura 8.6, de tal maneira que 
o sistema com realimentação de estados seja 
tipo 1, ou seja, a matriz (A — bK) deve ter 


um autovalor em 1. 


planta 


Sistema S 
Modelo M : (A, B,C) 


FIGURA 8.6: Diagrama de blocos do sistema 
com “planta” tipo 1 e controlador proporcio- 
nal. 


Uma vez que o sistema com realimenta- 
ção de estados, indicado por “planta” na Fi- 
gura 8.6, seja do tipo 1, basta usar um con- 
trolador proporcional para garantir que o erro 
em estado estacionário para entradas em de- 
grau seja nulo. 

Uma característica desse esquema é que 
uma vez fechada a malha externa, os autova- 
lores do sistema todo não mais são os auto- 


valores usados para determinar K. A escolha 
do ganho N pode ser feita, por exemplo, pelo 
método do lugar das raízes, como ilustrado 
no próximo exemplo. 


Exemplo 8.2.5 


Começamos refazendo o Exemplo 8.2.2, 
mas escolhendo os autovalores da malha 
interna, ou seja do bloco “planta”, para 
serem À = 1 e À» = 0,5. Nesse caso 
o procedimento do Exemplo 8.2.2 resulta 
em 


K = [46750 — 5,8975]. (8.40) 


Seguindo o procedimento do Exem- 
plo 8.2.3, chegamos a 


no) 88 (o . ros] + 


ae [6] [4,675 5808) sa | 


=0,51)[ 2t3575 39187 [05 
a: 5,6750 — z—5,0375 1 


= [0,51] 1 2-5,0375 3,9187 1[0,5 
C422-1,5240,5 | —5,67500 2+3,5375]| 1 
1,252 + 1,4 


DD DEqRas: 


A função de transferência encontrada pode 
ser utilizada para produzir o lugar das 
raízes mostrado na Figura 8.7, a partir 
do qual se pode escolher o ganho N para 
atingir especificações de controle, como 
visto na Seção 6.3. Neste exemplo op- 
tamos por colocar os polos de malha fe- 
chada em 212 = 0,72 + 50,24, que estão 
indicados por quadrados na Figura 8.7. 


FIGURA 8.7: Lugar das raízes referente 
ao Exemplo 8.2.5. Os polos do bloco 
“planta” estão indicados por cruzes e os 
polos do sistema completo estão indica- 
dos por quadrados. 


Como pode ser constatado da Fi- 
gura 8.8, o sistema projetado neste exem- 


plo tem erro nulo em estado estacionário 
para entradas em degrau quando o mo- 
delo é exato — o que não ocorre na prá- 
tica. 


FIGURA 8.8: Resposta ao degrau uni- 
tário do sistema projetado no Exem- 
plo 8.2.5. Os círculos mostram o resul- 
tado quando o modelo e a planta são 
iguais, e as cruzes, quando alguns parâ- 
metros da “planta” são diferentes das do 
modelo. 


O Exemplo 8.2.5 ilustra uma importante 


diferença no projeto usando o lugar das raí- 
zes, quando comparado ao projeto discutido 
no contexto de transformadas (ver Seção 6.4). 
Naquele contexto, se o lugar das raízes não 
passasse em uma região adequada do plano 
z (o mesmo raciocínio vale para o plano s 
no caso de sistemas em tempo contínuo) po- 
los e zeros de malha eram acrescentados por 
meio de algum regulador dinâmico como, por 
exemplo, um regulador de avanço de fase. No 
caso do projeto no espaço de estados, ao in- 
vés de acrescentar polos e zeros é possível, 
por realimentação de estados, reposicionar os 
polos de malha — assumindo que a planta é 
controlável — de tal forma que o lugar das 
raízes passe na região desejada. 


Uma dificuldade prática no Exemplo 8.2.5 
é que a integração da planta foi alcançada por 
meio da realimentação de estados. A coloca- 
ção de um autovalor de (A—bK) exatamente 
em À = 1 foi possível, pois assumiu-se que 


A e b são perfeitamente conhecidos, o que 
nunca é o caso na prática. À Figura 8.8 mos- 
tra o que ocorre se alguns parâmetros são le- 
vemente alterados. Assim, o mais seguro em 
situações experimentais semelhantes a esse é 
aceitar que a planta com realimentação de es- 
tados é do tipo O e adicionar um controlador 
integral. Isso é abordado a seguir. 


Planta tipo O e controlador integral. 
Neste caso, como a planta não tem ação inte- 
gral, esta deve ser adicionada e o respectivo 
ganho pode ser ajustado, por exemplo, pelo 
método do lugar das raízes. Assim, podemos 
imaginar que a menos de um fator constante 
— a ser ajustado —, a planta foi aumentada 
com um estado proporcional à “integral” do 
erro, como mostrado na Figura 8.9. 


planta aumentada 


ai(k) o u(k) Sistema S 
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FigurA 8.9: O bloco “planta aumentada” 
é do tipo 1 por imposição da ação “integral”. 
O ganho k; correspondente pode ser ajustado 
por técnicas diversas. 


Portanto, definindo o erro e(k) = r(k) — 
y(k) e, em tempo discreto, sua “integral” é 
dada pela soma dos seus valores passados, 
ou seja, 


gi(k+1) = zi(k)+ke(k). (8.41) 


Agora basta ajustar k;, por exemplo, utili- 
zando o método do lugar das raízes. Como 
mostrado no Exemplo 8.2.6, esse procedi- 
mento é mais robusto com respeito ao mo- 


delo. 


Exemplo 8.2.6 


Voltamos a considerar o modelo do Exem- 
plo 8.2.2. Os polos desejados para o sis- 
tema por realimentação de estados são 
A = —0,8 e À = 0,45. Esses valores fo- 
ram escolhidos a fim de que o lugar das 
raízes passe próximo à posição desejada 
para o par de polos dominantes 242 = 
0,72 + 30,24 usados no Exemplo 8.2.5. O 
vetor de ganhos calculado pela fórmula 
de Ackermann é K = [0,8250 — 2,0625]. 

Como se deseja um sistema tipo 1 
acrescenta-se “integração” ao ramo di- 
reto, como visto no seguinte trecho de 
código. 


% polinomio caracteristico desejado 
p=conv([1 -0.45], [1 0.8]); 


% usando a funcao Acker 
% ganho para alocacao de polos 
Ka=acker(A,B,roots(p)); 


% funcao de transferencia 

[num, den]=ss2tf (A-B+Ka,B,C,0,1); 
Den=conv([1 -1],den); 

modelo=tf (num,Den,-1); 


% lugar das raizes 
[R,KK]=r1ocus (modelo) ; 


Note a inserção de um polo em z=1 
logo após obter a função de transferência 
a partir das matrizes de estado. Com o 
modelo da planta aumentada — agora do 
tipo 1 =, ou seja, com o modelo que tem 
esse polo em z=1, calcula-se o lugar das 
raízes que é retornado na matriz R. Cada 
coluna dessa matriz tem três linhas, que 
correspondem aos três polos de malha fe- 
chada para os valores correspondentes de 


ganho, que estão no vetor KK. 

A décima sétima coluna de R tem os 
valores 242 = 0,74+ 50,23, que são os do- 
minantes, e 23 = —0,83. Como os polos 
dominantes estão suficientemente perto 
dos valores desejados, buscamos o valor 
do ganho na décima sétima posição do 
vetor KK, que resulta em k; = 0,07. A 
resposta ao degrau do sistema em ma- 
lha fechada é mostrada na Figura 8.10 
usando círculos. 

Por fim, para constatar a robustez do 
sistema projetado, alteramos alguns pa- 
râmetros do modelo utilizado para fazer 
o projeto. Ou seja, os valores projeta- 
dos de K e k; permanecem inalterados, 
mas agora fecha-se a malha usando um 
modelo diferente. Os novos parâmetros 
são: ay = —1,1 (em vez de —1,2), ao» = 
—(,85 (em vez de —0,8), b, = 1,1 (em vez 


de 1) ec; = 0,4 (em vez de 0,5). À res- 
posta nesse caso tem um transiente um 
pouco diferente, mas ao contrário do que 
foi visto no Exemplo 8.2.5, o erro em es- 
tado estacionário permanece nulo, como 
indicado na Figura 8.10 usando cruzes. 


y(k) 


90 100 110 120 130 140 


FIGURA 8.10: Resposta ao degrau uni- 
tário do sistema projetado no Exem- 
plo 8.2.6. Os círculos mostram o resul- 
tado quando o modelo e a planta são 
iguais, e as cruzes, quando alguns parâ- 
metros da “planta” são diferentes das do 
modelo. 


8.3 Observação de Estados 


Na Seção 8.2 vimos que se um sistema é con- 
trolável, é possível escolher novas posições 
para todos os polos por meio de realimenta- 
ção de todo o vetor de estado. Em princípio, 
isso pode ser realizado se o vetor de estado 
estiver disponível o que é viável se: i) todas 
as variáveis de estado forem variáveis físicas 
e se, ii) todas forem medidas. Não é difícil 
imaginar situações em que isso não acontece. 
Como proceder em tais casos? Observadores 
de estado, desenvolvidos na presente seção, 
são usados para “estimar” o vetor de estado e 
este, então, pode ser usado para implementar 
uma lei de controle semelhante à estudada 
na Seção 8.2. Alguns autores usam o termo 
estimação de estados para a mesma tarefa, 
mas preferimos reservar os termos estimação 
e estimadores para o caso estocástico. Como 
no presente capítulo lidamos somente com o 


caso determinístico, usamos os termos obser- 
vação e observadores de estado. 


Considere um sistema & (ver Figura 8.11) 
do qual se tem um vetor de saídas y e IR?. 
Por decisões de análise e projeto, resolve-se 
representar S em espaço de estados, ou seja, 
o modelo M do sistema é escrito em termos 
de matrizes de estado (4,B,C) e o vetor 
de estado no instante k é representado por 
av(k) e Rº. O problema de observação de 
estado pode ser enunciado a seguir. 


FIGURA 8.11: Sistema S com vetor de entra- 
das u e vetor de saídas y. Supõe-se que tal 
sistema pode ser bem descrito por um mo- 
delo M representado em espaço de estados. 


Observação de estado. Seja um sistema 
com representação em espaço de estado 
(A, B,C) com vetor de estado a(k) e R”. 
A partir desse modelo, do vetor de saída 
y(k) E IR? e do vetor de entradas u(k) € 
R”, 0O<k< oo, deseja-se obter £(k) e IR” 
tal que &(k) = x(k), ko < k < oo, em que 
&(k) é o vetor de estado observado. 

Em palavras, o problema de observação 
de estados é o de encontrar um vetor &(k) 


que se aproxime do vetor de estado “verda- 
deiro” a(k) a partir de um determinado ins- 
tante ko. Se isso for possível, £(k) pode ser 
utilizado para, por exemplo, realimentação e 
alocação de polos. A seguir mostramos ma- 
neiras de realizar a observação do vetor de 
estado. 


8.3.1 Observadores de estado 


Com respeito à Figura 8.11, a informação dis- 
ponível sobre o sistema S encontra-se na re- 
lação entre o vetor de entradas u(k) e o ve- 
tor de saídas medidas y(k) e no modelo M. 
Um ponto sutil, mas importante de notar, 
é que as variáveis de estado observadas, na 
realidade, são as do modelo M. Espera-se 
que tais variáveis de estado sejam eficazes no 
controle do sistema S. Para isso, dentre ou- 
tras coisas, é importante que M descreva a 
dinâmica de S em condições de operação de 


interesse. 


Motivação 


Comecemos escrevendo o modelo M do sis- 
tema S como: 


c(k+1) = Ax(k) + Bu(k) 
ulk) = Ce(k). (8.42) 


O alvo é encontrar uma aproximação do vetor 
de estado x(k), que indicaremos por £(k). 
Como supomos conhecer o modelo, ou seja, 
temos (4, B,C€) podemos duplicar o modelo 
em (8.42) e escrever 


g(k+1) = Ag(k) + Bu(k) 
Ulh) ="Calk): (8.43) 
Como visto na Seção 7.3, as equações que 


descrevem a evolução do estado a partir de 
uma condição inicial e sob a ação de entradas 


é dada por (ver Eq. 7.51) 


k—1 

Ate(0) + > 48" Bu(n) 
n=0 
k—1 


&(k) = Ate(0)+5 At" Bu(n), 


n=0 


para o modelo M e para a duplicata em 
(8.43), respectivamente. Definindo e(k) = 
a(k) — £(k), temos que e(k) = Ate(0), em 
que e(0)=x(0)-&(0). Esse resultado é uma 
consequência direta de usarmos as matrizes 
do modelo em (8.43) e usarmos a mesma en- 
trada em ambos os casos. Na prática não é 
possível em geral determinar x(0) com pre- 
cisão infinita para usarmos essa condição ini- 
cial em (8.43), ou seja, e(0) 4 0. Como con- 
sequência disso, se À tiver autovalores com 
módulos maiores que um, e(k) crescerá inde- 
finidamente. Ainda que todos os autovalores 
de A tenham módulo estritamente menores 


que um, se o módulo de um ou mais autova- 
lores for próximo a um, o erro e(k) pode levar 
muito tempo para ficar pequeno. Além disso 
seria necessário determinar a condição inicial 
toda vez que o observador fosse inicializado. 
Isso é custoso e inconveniente. 


Está claro que é necessário atuar em (8.43) 
de maneira a garantir que e(k) > 0 e, por- 
tanto, ter que £(k) > a(k). A seguir abor- 
damos o problema de forma simples e natural 
do ponto de vista de um sistema de controle 
realimentado. Outras maneiras de derivar as 
equações do observador são apresentadas nos 
complementos 8.1 e 8.2. 


Concepção 


Em problemas de controle realimentado, a 
fim de corrigir um desvio, medimos tal des- 
vio e atuamos de maneira a compensá-lo. No 
problema de observação de estado, isso é di- 
ficultado pelo fato de que o vetor de estado 
(onde aparecem os desvios que desejamos com- 
pensar) não é medido. Contudo, mede-se a 
saída que, está relacionada ao vetor de esta- 
dos, como mostra a Eq. 8.42. Portanto, pa- 
rece razoável atuar em (8.43) de forma pro- 
porcional ao erro entre as saídas do modelo 
M, y(k), e de (8.43), y(k). Portanto, imple- 
mentamos o seguinte sistema com controle 
proporcional (ver Figura 8.12): 


&(k+1) = Ag(k) + Bu(k) + Gly(k) — g(k)] 
W(k) = Cé(k), (8.44) 


em que G é uma matriz (ou vetor) de ga- 
nho. A equação dinâmica em (8.44) pode ser 
reescrita 


&(k+1) = A&(k) + Bu(k) + Gy(k) — Gi(k) 
= A&(k) + Bu(k) + Gy(k) — GC&(k) 
= (A-— GC)&(k) + Bulk) + Gy(k), (8.45) 


que é a equação dinâmica do observador de 
estado, e cuja equação de saída é dada pela 
segunda equação em (8.44). Em (8.45), a 
única incógnita é a matriz G. Portanto, pro- 
jetar o observador consiste em escolher G de 
maneira que &(k) = a(k), ko < k < 00. À 
determinação da matriz G é tratada na Se- 
ção 8.3.2, mas por agora consideremos sim- 
plesmente que o observador é estável, ou seja 
é necessário que |eig(A — GC)| < 1, em que 
eig(X) indica os autovalores de X. 


FigurA 8.12: Representação do problema 
de observação como o de um sistema com lei 
de controle proporcional. O bloco pontilhado 
indica o modelo duplicado em (8.43). 


O observador é representado juntamente 
com o sistema S de maneira mais natural, na 
Figura 8.13. 


Sistema S 
Modelo M : (A4,B,0) 


FIGURA 8.13: Observador de estado O co- 
nectado ao sistema S. O observador utiliza 
o modelo M do sistema e recebe as entradas 
u e o vetor de saídas medidas y. 


O funcionamento do observador é o de um 
modelo em malha fechada em que o vetor de 
estado é corrigido por uma parcela propor- 
cional ao erro de saída y(k) — y(k). Se o 
modelo fosse perfeito e a condição inicial do 
observador coincidisse perfeitamente com o 
do sistema, a realimentação não seria neces- 


sária na ausência de distúrbios (ver Exercí- 
cio 8.10). Quando o observador estiver em 
regime permanente, o vetor de estado &(k) 
pode ser usado como substituto para o vetor 
de estado do sistema x(k) que normalmente 
não é medido. O uso de &(k) para imple- 
mentar uma lei de controle é investigado na 
Seção 8.3.5. 


Exemplo 8.3.1 


Neste exemplo implementamos um ob- 
servador para usando o modelo 


[ettto] = [8 cas) [28] +["P] om 
ve) = [05 Tel) 


referido como “o sistema”. O ganho do 


observador é: 


1,0727 
Gis ES 


O Exemplo 8.3.2 detalha como obter o 
vetor de ganhos. Portanto, usando as 
matrizes (4, b, c”) e o vetor de ganhos G, 
a equação do observador é escrita como: 


Si ds E Bi ft 1) SR 
E] [UE] no 
a fis ad] &(k)+ El u(k) + 


1,0727 
EE ER uh). 


À equação de saída do observador é y(k) = 
c't(k). A Figura 8.14 mostra as variá- 
veis de estado do sistema e as do observa- 
dor, e a Figura 8.15 mostra as respectivas 
saídas. Como pode ser visto, as variáveis 


de estado do observador convergem para 
as do sistema. 


(a) 


2 
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FIGURA 8.14: (—) variáveis de estado 
do sistema e (- -) do observador. Em 
(a) zi(k) e Zi(k) e em (b) x5(k) e Zo(k). 
A partir do instante k = 15 as diferenças 
são imperceptíveis. 


A simulação do sistema e do observa- 
dor pode ser realizada com os comandos: 


0.5+ || 
| 
L NI A a 


10 20 30 40 
k 

FIGURA 8.15: (—) Saída do sistema y(k) 

e (- -) saída do observador ú(k). À par- 

tir do instante k = 15 as diferenças são 

imperceptíveis. 


x=zeros(2,40); ) estados do sistema 
xh=zeros(2,40); ) estados do observador 


x(:,1)=[1;-1]; Y condição inicial do sistema 
y(1)=C*x(:,1); Y saída inicial do sistema 


% condição inicial do observador 
xh(:,1)=randn(2,1); 

% saída inicial do observador 
yh(1)=C*xh(:,1); 
u=[zeros(25,1);ones(15,1)/5];) entrada 


for k=1:39 
Y% simula sistema 
x(:,k+1)=A+x(:,k)+B+xu(k) ; 
y(k+1)=C+xx(:,k+1); 


Y% simula observador 
xh(:,k+1)=(A-G+*C)+*xh(:,k)+B+u(k)+G+y (k) ; 
yh(k+1)=C*xh(: ,k+1); 

end 


8.3.2 Projeto de observadores 


Em geral, uma condição necessária, mas não 
suficiente, é que o observador seja estável, ou 


seja, os autovalores de (A — GC), a matriz 
dinâmica do observador, devem ter módulo 
menor que um. Os autovalores são as raízes 
da equação característica do observador que 
é dada por: 


I-(A-GO)| = 0. (8.46) 


Assim como no caso da alocação por rea- 
limentação de estados, se a equação carac- 
terística desejada para o observador for co- 
nhecida, é possível determinar G em (8.46). 
Em outras palavras, devemos escolher G para 
alocar os polos do do observador, que são os 


autovalores da matriz (A — GC). 

Assim como a escolha da matriz de ga- 
nho K no caso da realimentação de estados 
determina a localização dos polos de malha 
fechada, a escolha de G determina os polos 
do observador. O efeito do polos de malha 


fechada sobre a dinâmica do sistema, contro- 
lado é algo conhecido, mas qual é o efeito dos 


polos do observador? Para responder a essa 
pergunta, definiremos o erro de observação 


e determinamos a equação que descreve sua 


dinâmica. O erro de observação é definido 
como: 


e(k+1) = e(k+1)- &(k+1) 
= Ag(k)+Bu(k)-[(A-GO)&(k)+Bu(k)+Gy(k)] 


Ax(k)+Bu(k)-(A-GO)&(k)— Bulk) -GCa(k) 
= (A- GC)e(k) — (A — GO)&(k) 
= (A- GC)e(k). (8.47) 


A expressão (8.47) mostra que — se o sistema 
e o observador tiverem o mesmo modelo — a 
dinâmica do erro é regida por uma equação 
dinâmica autônoma, sem funções forçantes 
dependentes de k, e que essa dinâmica é go- 
vernada pela própria matriz dinâmica do ob- 
servador (ver Exercícios 8.7 e 8.8). Assim, se 
G for escolhida de maneira que o observador 
seja assintoticamente estável, o erro também 
o será e o vetor de estado do observador con- 
verge para o vetor de estado (do modelo) do 
sistema de maneira assintótica. 


8.3.3 A fórmula de Ackermann 


A escolha da matriz G pode ser realizada uti- 
lizando a fórmula de Ackermann para o caso 
monovariável (ver Exercício 8.9): 


—1 


c! 0 
clAÃ 0 
G = AoA) | CA : |, (8.48) 
0 
CTA! 1 
em que o vetor [00 ...01]",temn— 1 zeros 


e o último elemento é 1, e Ago(À) é o polinô- 
mio característico desejado para o observa- 
dor. Assim, os polos do observador devem 
ser as raízes Ao;, | = 1,...,n de Ago(A), ou 
seja 

AS, (Ra eb eai 

=" LanaNUTIL...+tal+tao 
Ago(A) = A" Lana AI +... +aA+agl. (8.49) 


Uma regra heurística utilizada no projeto 
de observadores é que seus autovalores sejam 


de duas a quatro vezes mais rápidos que os 
autovalores do sistema controlado (Phillips e 
Troy Nagle, 1995, p. 349). 


Olhando para a Figura 8.13 é possível 
perceber que a matriz G é uma matriz de 
ganho que multiplica o erro de observação 
y — y. Logo, se o modelo usado no obser- 
vador for muito bom, o ganho de correção, 
implícito em G, não precisa ser grande. O 
contrário é verdadeiro, se o modelo for ruim, 
é necessário realizar ajustes mais severos, au- 
mentando G. Contudo, se a qualidade da 
medida foi ruim, y — % não é confiável e G 
não deve ser elevado. Assim, em um cenário 
em que o modelo é mais confiável que as me- 
didas y, G é pequeno, ao passo que em um 
cenário de boas medições mas modelo ruim, 
G tende a ser maior. Em outras palavras G 
pode ser visto como um parâmetro que re- 
flete a qualidade relativa do modelo frente 
ao vetor de medidas, e vice-versa. Esse tipo 


de raciocínio é bastante adequado para a in- 
terpretação da operação do filtro de Kalman, 
que é um estimador de estados no contexto 
estocástico. 

Em (8.48), a matriz com linhas cT 4º € 
R'X” é a matriz de observabilidade e tem 
dimensão n x n para o caso de sistemas de 
uma saída. A matriz de observabilidade para 
o caso multivariável foi apresentada em (8.9). 
As fórmulas de Ackermann de controlador e 
observador só se aplicam a sistemas SISO (do 
inglês single-input single-output). A fim de 
alocar todos os polos do observador é neces- 
sário que o sistema seja completamente ob- 
servável, o que corresponde à matriz de ob- 
servabilidade ter posto completo de colunas. 


Exemplo 8.3.2 


Neste exemplo fazemos o projeto de um 
observador para o sistema do Exem- 
plo 8.2.2, sendo que vetor de ganhos é cal- 


culado usando a fórmula de Ackermann 
em (8.48). O sistema em malha aberta é: 


ER E o 
y(k) = [0,5 1 Jac(k). 


O autovalor em À, = —1,2 é instável. A 
constante de tempo relacionada ao auto- 
valor À» = —0,8 é 7 = —T/In|Aso|. Por- 
tanto, assumindo T = 1s, tem-se 7H 
4,5s. Sugere-se escolher os polos do ob- 
servador duas a quatro vezes mais rápi- 
dos que os polos do sistema realimentado. 
Polos duas vezes mais rápido estão em 
torno de À = 0,6 e polos quatro vezes 
mais rápidos estão em torno de À x 0,4. 
Escolhemos A, = 0,5, como a posição 


para os autovalores do observador. 
Primeiramente, verificamos se o sis- 
tema é observável. A matriz de observa- 


bilidade é: 
fia a | E E ns E (Ro) 


e seu posto é dois, indicando que o sis- 
tema é totalmente observável. O polinô- 
mio característico para o observador é: 


Ago(A) = (A— 0,5) = A? — À + 0,25. 


Portanto, tem-se que 


2 
Eai qa 
Aao(4) = | 0 E -| 0 nai | 
10 
+0,25 | nda | 
289 —3,0 
So ou aos 


Por fim, o vetor de ganhos é dado 


por (8.48): 


G = Ass joaj 


DP Za eso eso esto Di RO 
pio ia: SE ela 1 
[| -9,7556 
= ae 


De fato, (A— Ge?) tem os autovalores 
desejados. No Matlab o vetor de ganhos 
G pode ser determinado usando a função 
acker da seguinte maneira: 


G=acker (A? ,C?,[0.5;0.5])”; 


Note que como o problema de deter- 
minar G é o dual de determinar K, basta 
usar A” no lugar de 4 e c” no lugar de 
b e transpor o resultado, como discutido 
na Seção 8.1.4. O desempenho do ob- 
servador projetado pode ser visto na Fi- 
gura 8.16. Note que mesmo o sistema 
sendo instável, o observador (que é está- 


vel) converge, e depois de dez iterações, 
a diferença visual dos estados do sistema 
e do observador é imperceptível. Esse re- 
sultado ilustra que os conceitos de esta- 
bilidade e observabilidade não estão rela- 
cionados, sendo distintos. 


FIGURA 8.16: Saída (—) do sistema y(k) 
e (- -) do observador y(k). Condição ini- 
cial do sistema é x(0) = [1 — 1]" ea do 
observador, escolhida de maneira aleató- 
ria, é &(0) = [3,5784 2,7694]T. 


8.3.4 Função de transferência 
do controlador 


Uma vez projetado o observador, é possível 
usar suas variáveis de estado em uma lei de 
controle como u(k) = r(k) — Ká(k), como 
ilustrado na Figura 8.17. Esse esquema de 
controle é conhecido como alocação de polos 
por realimentação de saída, pois realimenta- 
se a saída do sistema em vez das variáveis de 
estado. 


O sistema projetado para alocar polos 
por realimentação de saída, mostrado na Fi- 
gura 8.17, pode ser redesenhado como mostra 
a Figura 8.18, em que se supôs que a referên- 
cia é zero, a planta existe em tempo contínuo 
e é monovariável. M na Figura 8.17 é o mo- 
delo em tempo discreto da planta. 


+ a Sistema S É 
1 Modelo M : (4,B,C) 
E ; 


Observador O 


FIGURA 8.17: Sistema com lei de controle 
u(k) = r(k)—-Ká(k). 


Qual é a função de transferência do sis- 
tema controlado por realimentação da saída, 
ou seja, utilizando um observador? Para res- 
ponder a essa pergunta, passamos a conside- 
rar o observador 


&(k+1) = (A-Ge)&(k) + bulk) + Gy(k) 


com a lei de controle u(k) = — Ká(k). Subs- 
tituindo essa lei na equação do observador 


chega-se a 
&(k+1) = (A-Ge” - bEJ&(k) + Gy(k). (8.51) 


Tomando a transformada Z de (8.51) com 
condições iniciais nulas, tem-se: 


2X(2) = (A-Ge” -bR)X() +GY(2) 
X(2) = (2-A4+Ge +bK) loy(2). (8.52) 


as Del?) He) DIA Sistema S a) 
Y(z) [| 


FiGURA 8.18: Diagrama de blocos simplifi- 
cado da Figura 8.17, em que tanto o observa- 
dor como o ganho K estão no bloco indicado 
por Dco(z). Considera-se aqui o caso mono- 
variável. 


Por fim, como U(z) = —KX(z), da 
Eg. 8.52 podemos escrever: 


U(z) = -K(zl- A+Ge" +bK) lay (2) 
U(z) 


o K(2I-A+Ge” +b6K) IG = Dco(2). (8.53) 


Em palavras, o projeto de um par controlador- 
observador — também conhecido como o pro- 
blema de alocação de polos por realimenta- 
ção de saída — para o caso monovariável cor- 
responde ao projeto de uma função de trans- 
ferência, como a mostrada em (8.53). 


Exemplo 8.3.3 


Neste exemplo usamos o observador pro- 
jetado no Exemplo 8.3.2 para estabili- 
zar o sistema usando a lei de controle 
u(k) = —Ká&(k) com vetor de ganho cal- 
culado no Exemplo 8.2.2. Além disso, 
determinamos a função de transferência 
do controlador correspondente. 
Portanto, com K = [5,2500 — 6,3250] 


e G = [-9,7556 1,8778]”, e condição ini- 
cial a(0) = [1 — 1]”, a resposta do sis- 
tema em malha fechada é mostrado na 
Figura 8.19. Lembre-se que o sistema em 
malha aberta é instável. Portanto, a lei 
de controle u(k) = — K&(k) foi capaz de 
estabilizar o sistema. 
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FIGURA 8.19: Saída y(k) com condição 
inicial ae(0) = [1 — 1" e lei de controle 


u(k) = —K&(k). 


Para obter a função de transferência 
correspondente do controlador implemen- 


tado, usamos (8.53). Logo 


Ui(z) z— 1,0528 —13,918 ]7! 
sa 63250] 6,189 E] 
—9,7556 
1,8778 


1 
x 
22 — 4,Tz + 89,977 


z— 3,6472 13,918 —9,7556 
—6,1889 z-— 1,0528 1,8778 


— —63,094z — 45,367 
2-4 Tz+89,97T 


[5,2500 — 6,3250] 


(8.54) 


A equação característica do sistema em 
malha fechada é: 


—63,094z — 45,367 


0 = 14 G(z 
2472 + 89,977 0) 
—63,0942 — 45,367 1 
ta É [0,5 1] x 
2—4,72+ 89,977 22 +22 + 0,96 


z+0,8 1 0,5 
0 Z+1,2 1 


63,094z + 45,367 1,252 + 1,9 


(8.55) 
22 — 4,72 + 89,977 22 + 22 + 0,96 


que tem raízes em z = 0,9, 2 — 0,8 e 
duas em z = 0,5, conforme o projeto. É 
curioso observar que a função de trans- 
ferência U(z)/ — Y (2) é instável. Note 
que o que foi implementado foi a lei de 
controle u(k) = —Ká(k) e não a função 
de transferência (8.54). Contudo, o fato 
de a função de transferência do controla- 
dor ser instável indica potenciais dificul- 
dades em um contexto prático, notada- 
mente a falta de robustez. Para verificar 
isso, calculamos as margens de ganho e 
de fase para este exemplo que são, res- 
pectivamente, OdB e 0º. Rigorosamente 
falando, o valor da margem de fase é le- 
vemente negativo —0,001º, o que é pro- 
vavelmente um erro numérico. De todo 
jeito está caracterizada a falta de robus- 
tez. Isso significa que para pequenos des- 
vios entre o modelo e a dinâmica do sis- 
tema, o controlador projetado utilizando 


o modelo não resultará em uma malha fe- 
chada com as características almejadas. 

Qual é a origem dessa falta de robus- 
tez? Provavelmente seja que o contro- 
lador projetado é bastante exigido, pois 
toma os polos de malha aberta da planta 
que estãoem ÀA= —-12eA=-O8eos 
realoca em À = 0,9e À = 0,8. Uma si- 
tuação em que os polos não precisam ser 
movidos tanto é investigada no próximo 
exemplo. 


Exemplo 8.3.4 


Neste exemplo fazemos o projeto de um 
sistema de controle por alocação de po- 
los via realimentação de saída semelhante 
ao que acabamos de ver, mas iniciaremos 


com o sistema mais fácil de controlar 
2858] =[8 3) [589 ][%] 05 
Os autovalores da matriz 4 são A = 1,2 
e À» = 0,95 e, portanto, o sistema é ins- 
tável, mas note que os autovalores es- 
tão do lado positivo do plano complexo, 
comparado ao sistema usado em exem- 
plos anteriores (veja Exemplo 8.2.2). Im- 
plementamos a lei de controle u(k) = 
r(k)— Ká(k), mas lançando mão do prin- 
cípio da separação, projetamos o vetor 
linha de ganho K como se tivéssemos co- 
nhecimento de todo o vetor de estado 
O sistema é controlável e observável. 
Escolhemos os autovalores de malha fe- 
chada em À = 0,9 e À = 0,8. Ássim 


o polinômio característico para o sistema 
controlado é: 


Eno 


Ma = (DO MB = TONA: 


Assim, tem-se que 


0,12 0,45 
Gatto 0 ora 


Por fim, o vetor de ganhos é dado por 
(8.28): 


o pe) 
=[01) 0,5 1,6 1! [0,12 0,45 
E 10,95 O 0,0075 
= [0,1067 0,3967], 


que é composto de valores bem meno- 
res que aqueles encontrados no Exem- 
plo 8.2.2. Uma razão para isso é que na- 
quele exemplo os autovalores de 4 preci- 
savam ser deslocados muito mais no plano 
complexo do que neste exemplo. Por isso 
dizemos que o sistema (8.56) é mais fácil 
de controlar. 


Uma vez determinado K, podemos 
prosseguir para o projeto do observador 
e a determinação do vetor de ganho G. 
Como os polos de malha fechada não fo- 
ram alterados, em princípio não há razão 
para mudarmos a localização dos auto- 
valores do observador, ou seja, os auto- 
valores de (A — Ge”). Assim mantendo 
Ao = 0,5 como no Exemplo 8.3.2, o po- 
linômio característico para o observador 
continua sendo: 


NA A jp A NUS, 
Portanto, tem-se que 


049 1,15 
e = fo RG 2025 E 


O vetor de ganhos é dado por (8.48): 
ERA oo 
0,49 1,15 (6 O 
= 0 ana 4] Ea 
= 0,68 | 
0,81 | 
A seguir obtemos a função de trans- 
ferência que corresponde ao controlador 


“equivalente”, pensando em termos de fun- 
ções de transferência usando (8.53): 


U(z) z-0,8067 0,1217 ]-![0,68 
vo fito 03967] -0,5117 2z— en 0,81 


1 
a E 
22 — 0,552 + 0,1448 
z-— 0.2567 —0,1217 0,68 
0,5117  z-— 0,8067| | 0,81 
0,3938z — 0,3681 
22 — 0,552 + 0,1448' 


= [0,1067 0,3967] 


A equação característica do sistema em 


malha fechada é 


0,3938z — 0,3681 
0 14 G(z) 
22 — 0,55z + 0,1448 
0,3938z — 0,3681 | 1,252 — 0,9375 


22 — 0,552 + 0,1448 22 — 2,152 + 1,14' 


que, como antes, tem raízes em z = 0,9, 
z = 0,8 e duas em z = 0,5. Ao contrário 
do que foi observado no Exemplo 8.3.3, 
agora a função de transferência U(z)/ — 
Y(z) é estável. Em ambos os exemplos, 
as malhas fechadas implementadas foram 
estáveis. Mas fato de U(z)/ — Y (2) ser 
instável no Exemplo 8.3.3 indica que o 
caso em questão não seria robusto mesmo 
a pequenos erros no modelo. No presente 
caso, por tratar de uma planta mais fácil 
de controlar, U(z)/—Y (2) é estável o que 
sugere que o projeto tem maior robustez. 
A fim de verificar isso, posto que temos 
a função de transferência equivalente do 


controlador e a da planta, podemos cal- 
cular as margens de ganho e de fase. Para 
o presente exemplo, a margem de ganho 
é em torno de 8dB e a margem de fase 
é 34º, que não é tão confortável como se 
gostaria. Este exemplo ilustra também 
que o atual procedimento dificulta proje- 
tar um sistema com margem de fase espe- 
cificada. De fato, robustez em espaço de 
estados é alcança utilizando outros pro- 
cedimentos (Cruz, 2022). 


8.3.5 O princípio da separação 


Quando o sistema com modelo descrito por 
(A, B,C) é controlado pela lei u(k) =r(k) — 
Ka(k), a equação característica do sistema 
em malha fechada é: 


I-A+BK|=0. (8.57) 


Agora, se o vetor de estado não estiver 
disponível para realimentação, podemos pro- 
jetar um observador com ganho G e imple- 
mentar a lei de controle u(k) = r(k)-K£(k), 
como feito na Figura 8.17. Desejamos saber 
qual é a equação característica de um sistema 
com modelo descrito por (4, B,C) com a re- 
ferida lei de controle. Portanto, escrevemos: 


e(k+1) = Agx(k) — BK&(k) + Br(k) 
Ax(k) — BK[a(k) — e(k)] + Br(k) 
(A-— BK)x(k) + BKe(k) + Br(k)(8.58) 


em que e(k) = a(k) — &(k) é o erro de obser- 
vação e sua dinâmica é descrita por (8.47). 


Logo, o sistema estendido pode ser escrito 
como: 


[Ee 8 [ES] [E] nenem 


que, sendo uma matriz bloco triangular su- 
perior, sua equação característica é dada por 


Il -A+BKI||2l- A+GC|=0. (8.60) 


O resultado indicado em (8.60) é conhe- 
cido como o princípio da separação e foi apre- 
sentado em (Joseph e Tou, 1961). Esse prin- 
cípio mostra que o projeto do observador não 
afeta a alocação de polos e vice-versa, su- 
pondo que o observador usa o modelo sem 
incertezas do sistema. Em outras palavras, 
a escolha do ganho K pode ser feita imagi- 
nando que as variáveis de estado do sistema 
estão disponíveis para a implementação e a 
escolha do ganho G pode ser realizada su- 
pondo que não há realimentação do vetor de 
estado estimado. 


O sistema em malha fechada com a lei de 
controle u(k) = r(k) — Ká(k) é de ordem 
2n, pois além dos n polos da planta, há tam- 
bém os n polos do observador. Em outras 
palavras, a matriz em (8.59) tem dimensão 
2n x 2n. Assim, o sistema em malha fechada 
tem 2n polos, sendo que n são aqueles utili- 
zados para determinar K, ou seja, os polos 


desejados para o sistema controlado, e os ou- 
tros n polos são os do observador. 

Um ponto crucial no desenvolvimento 
acima é que ao utilizar o resultado em (8.47) 
para descrever a dinâmica do erro, assume- 
se que o modelo do observador é exatamente 
o mesmo que o modelo do sistema. Se es- 
ses modelos forem diferentes, como ocorre na 
prática, os polos do sistema realimentado e 
os do observador não estarão “separados” e os 
polos de malha fechada não serão exatamente 
os utilizados para o projeto da realimentação 
de estados e para o projeto do observador. 


8.3.6 Observadores de 
ordem reduzida 


Até este ponto, temos projetado observado- 
res de ordem completa, ou seja, algoritmos 
capazes de observar todo o vetor de estado, 
a partir de três elementos: o modelo do sis- 


tema, a entrada e a saída. Se a saída for um 
único sinal e corresponder a uma das variá- 
veis de estado do sistema, nota-se que essa 
variável de estado, em princípio, não precisa 
ser observada, uma vez que está disponível 
por medição. Além disso, é possível que se te- 
nha um vetor de saídas y(k) correspondente 
a mais de uma das variáveis de estado do sis- 
tema. Portanto, um importante problema a 
ser investigado é o projeto de observadores 
de ordem reduzida, em que somente as va- 
riáveis de estado que não são medidas é que 
precisam ser observadas. Esse é o problema 
investigado nesta subseção. 


Comecemos particionando o vetor de es- 


tado da seguinte forma 


2(k) = | a | , (8.61) 


em que tm E IR”” são as variáveis de estado 
que são medidas e x, € IR”º são aquelas que 
devem ser observadas, sendo que nm +no = n. 
Assim, o modelo do sistema pode ser repre- 
sentado como 


| em(k+1) | Ain) Aa I[ mk) | Bm Jute) 


Zo(k + 1) Am | Avo Xo(k) Bo 
y(k) = [Im | 0] e (8.62) 


em que Im € IR”” é a matriz identidade de 


ordem ny. 

Na representação em espaço de estados 
em (8.62) há grandezas medidas e grandezas 
que não o são. Para derivar um observador 
de estado de ordem reduzida, separamos tais 
grandezas de maneira a representar o modelo 
na forma padrão, em que o vetor de estado 
é formado por grandezas intermediárias não 
medidas. Para isso, notamos que a equação 


vetorial de diferenças em (8.62) pode ser es- 
crita na forma de dois conjuntos de equações. 
O primeiro deles é: 


Em(k+ 1) = Ammem(k) + Amoxo(k) + Bmu(k) 
tm(k+ 1) — Ammim(k)— Bmu(k) = AmoXo(k), (8.63) 


sendo que foram colocadas do lado esquerdo 
de (8.63) as grandezas medidas. Portanto, a 
Eg. 8.63, a menos dos índices de tempo dis- 
creto, lembra a equação de saída no formato 
padrão y(k) = Ca(k), em que a parte co- 
nhecida está do lado esquerdo da equação e, 
do lado direito, o vetor de estado a ser obser- 
vado, Zo(k), pre-multiplicados por uma ma- 


triz. 
Prosseguimos escrevendo o segundo con- 


junto de equações de diferença em (8.62) 
como: 


Lo(k+1) = AomEm(k) + Avoxo(k) + Bou(k) 
= AvoXo(k) + [Bou(k) + AomEm(k)], (8.64) 


que pode ser interpretado como uma equa- 
ção de diferenças na forma de estado padrão, 


com um segundo conjunto de entradas que, 
neste caso, são as variáveis de estado medidas 
Ym(k). Portanto, comparando (8.64) com a 
forma padrão x(k + 1) = Ax(k) + Bu(k), 
e comparando (8.63) com a equação padrão 
de saída y(k) = Ca(k), chega-se ao seguinte 
conjunto de equivalências: 


gv + go(k) 
A Ao 
Bulk) — Bou(k) + Ambm(k) (8.65) 
y(k) — gm(k + 1) — AmmEm(k) — Bmu(k) 
C + Ano- 


Portanto, realizando as substituições indica- 
das em 8.65 nas equações do observador de 
ordem plena, tem-se as equações do observa- 
dor de ordem reduzida (ver Exercício 8.16): 


Zo(k+1) = (Aco — GAmo) £o(k) + (Bo — GBm) u(k) + 
HGy(k + 1) + (Aom — GAmm) y(k). (8.66) 


Logo, o projeto de um observador de or- 
dem reduzida consiste em 1) determinar a 


matriz G em (8.66), o que pode ser feito 
usando os mesmos procedimentos desenvol- 
vidos para os observadores de ordem plena 
e ii) implementar a equação de diferenças 
(8.66), que é o observador. Note que no ob- 
servador de ordem plena &(k -+1) depende de 
y(k), mas não de y(k + 1), como ocorre no 
caso do observador de ordem reduzida. 


A matriz de ganho G em (8.66) pode ser 
determinada usando as técnicas de projeto de 
observadores de ordem completa, usando-se 
a correspondência dada em (8.65). Por exem- 
plo, para o caso de sistemas com uma entrada 
e um estado medido, pode-se usar a fórmula 
de Ackermann (8.48) com Ago(A) sendo o po- 
linômio característico desejado para o obser- 
vador de ordem reduzida, Aso é Amo devem 
ser usados no lugar de 4 e c”, respectiva- 
mente. Nesse caso, deve-se lembrar que a 
ordem do observador procurado é n — 1, ou 
seja, a matriz de observabilidade na fórmula 


de Ackermann é uma matriz com dimensões 
(n—-1)x(n-—1). 

Se a relação sinal-ruído dos sinais medi- 
dos não for boa, pode ser preferível imple- 
mentar observadores de ordem plena, mesmo 
para o caso em que algumas variáveis de es- 
tado são medidas. 


Exemplo 8.3.5 


Considere as matrizes de um sistema em 
tempo discreto com T=0s: 


0 ao 1 
AE gor em q Bo 
0 0 0,95 1 
OO 
c=| 0 4 


Deseja-se projetar um observador para 
o sistema representado por esse modelo. 


Primeiramente nota-se que duas variá- 
veis de estado x, e x3 são medidas. Por- 
tanto, basta projetar um observador para 
estimar 7x9. Para isso, começamos re- 
escrevendo o sistema particionado como 


(18:02): 
ai (k+1) 

Em(k + 1) 
Ei | Sta 


avo(k+1) 
o o 
Tm (k) 
=[ 0 0,950 + 
Es 0 all RE) | 


y(k) = am(k) = e | j ] | aa | 


Portanto, a equação do observador em 


(8.66) é dada por 


£o(k+1) = (18-Ig 92] [6 | ) dot ip 


de (o-tor 92] fl u(k)+[91 92] pas i 9 


+ (t-097 o]-[g1 oo) nos Nas] . (8.67) 


A fim de determinar a matriz de ga- 
nhos G, começamos calculando os auto- 
valores da matriz do sistema 4, que são: 
ado — USE midia 005 Barado 
par de polos complexos conjugados tem- 
se que r=/0,81 + 0,16=0,97. Usando a 
última expressão em (6.38) tem-se que 
as constantes de tempo associadas a es- 
ses polos são: 7/2=6,5s e 9=2s. Es- 
colhendo a constante de tempo do ob- 
servador quatro vezes menor (o obser- 
vador deve ser mais rápido que a diná- 
mica observada) que a menor constante 
de tempo, tem-se: 7; = 0,58, ou seja, cor- 
responde a um polo em s= — 2 0 que cor- 
responde em tempo discreto a um polo 


nes PES BaLaos: 
(18-Ian oo]| E |) = 2 qm Il (8.68) 


sendo que estamos livres para escolher 9» 
de modo a atingir outros objetivos. Por 
simplicidade, escolhemos g, = 1. Por- 
tanto, a equação do observador é: 


Zo(k+1) = 0,8£0(k) — 2u(k) + yr (k+1) +yo(k+1) 
—0,974n (k) — 0,95yo (k). 


A Figura 8.20 mostra o desempenho 
do observador de ordem reduzida. O sis- 
tema foi simulado a partir de condições 
iniciais aleatórias e ruído branco gaus- 
siano com média nula e desvio padrão 
o = 0,2 foi adicionado às duas saídas. 
Os comandos Matlab usados foram: 


50 100 150 200 


FigurA 8.20: Em traço contínuo 
mostra-se xo(k) e, em tracejado, Zo(Kk). 


% matrizes do sistema 

A=[0 1 0;-0.97 1.80 0;0 O 0.95]; 
b=[1;0;1]; 

C=[1 00:00 1]; 


% condições iniciais aleatórias do sistema 

x(:,1)=[rand(1,1)-0.5,rand(1,1)-0.5, 
rand(1,1)-0.5]; 

ruido=0.2; Y desvio padrão do ruído 

% soma ruído às saídas 

y(:,1)=C+x(:,1)+randn(2,1)+*ruido; 


% condição inicial do observador de 
% ordem reduzida 
xh(1)=rand(1,1)-0.5; Y aleatória 


% transição em degrau unitário em k=100 
N=200; Y duração da simulação 
u=zeros(N,1); 
ulround(N/2):N,1)=ones(N-round(N/2)+1,1); 


for k=1:N-1 
% simula sistema 
x(:,k+1)=A+x(:,k)+b+u(k) ; 
y(:,k+1)=C+*x(:,k+1)+randn(1,1)+*ruido;; 


Y% simula observador de ordem reduzida 
xh(k+1)=0.8+xh(:,k)-2+*u(k)+y(1,k+1)+y(2,k+1); 

4% continuação 

xh(k+1)=xh(kK+1)-0.97+y(1,k)-0.95*y(2,k); 
end 


plot N (Os) NG ho bs 


Com o observador de ordem redu- 
zida projetado neste exemplo, é pos- 
sível implementar uma lei de controle 
por realimentação de estados do tipo 
u(k) = —Ká&(k), usando-se £(k) = 
[yr (k) £o(k) yo(k)”. 


8.3.7 Observadores filtros 


O observador em (8.44) é às vezes chamado 
de observador preditor, pois o vetor de estado 


observado no instante k + 1 faz uso apenas 
de informação passada, ou seja, no instante 
k. Em alguns casos, pode ser interessante 
esperar a chegada de uma nova medição, re- 
alizada em k-+1, para usá-la na determinação 
de £(k-+1). Nesse caso, fala-se de observado- 
res que usam valores atuais (correntes) ou, 
observadores tipo filtro, pois £(k+1) usa in- 
formação disponível em k + 1. Um exemplo 
disso é o observador de ordem reduzida pro- 
jetado no Exemplo 8.3.5. 

Para derivar esse tipo de observador, co- 
meçamos imaginando que temos o vetor ob- 
servado &*(k), em que o + significa que essa 
estimativa é “final”. De posse das matrizes 
Ae B,e da entrada, é possível ter uma es- 
timativa “provisória” do vetor de estado no 
próximo instante: 


& (k+1)=4%"(k)+Bu(k), (8.69) 


em que — indica que a estimativa é provisó- 
ria. Com a chegada da medição no instante 


seguinte, y(k + 1) é possível corrigir a esti- 
mativa &” (k + 1) da seguinte maneira: 


&T(k+1) = & (k+D+G[y(k+1)-C&” (k+1)] (8.70) 


em que a matriz G é um ganho proporcional, 
que determina a correção efetuada em &” (k+ 
1), em função do erro entre a medição y(k + 
1) e a saída estimada C& (k+ 1). 

Por fim, substituindo (8.69) em (8.70) 
chega-se à equação do observador filtro: 


&(k+1) = (A-GCA)&*(k) + B-GCB)u(k) 
+Gy(k+1). (8.71) 


É possível mostrar (ver Exercício 8.17) 
que a dinâmica do erro de observação de (8.71) 
é determinada pela matriz (A — GC A). Por- 
tanto, se G for escolhida de maneira a garan- 
tir que todos os autovalores dessa matriz te- 
nham módulo estritamente menor que a uni- 
dade, o vetor de estado observado convergirá 


para o vetor de estado do sistema de maneira 
assintótica. No próximo capítulo é apresen- 
tado o filtro de Kalman, cuja estrutura tem 
semelhanças ao observador filtro apresentado 
nesta seção. 


8.4 Complementos 


Complemento 8.1. O observador de Luen- 
berger 


Em 1963, quando ainda era aluno de dou- 
torado, David G. Luenberger submeteu um 
artigo à então IEEE Transactions on Mili- 
tary Electronics. O artigo foi publicado no 
ano seguinte com o título: Observing the state 
of a linear system (Luenberger, 1964). O 
problema de estimar estados de um sistema 
linear já havia sido considerado e resolvido 
por Rudolf Kalman, mas o conceito de um 


“observador de estado” é normalmente atri- 
buído a Luenberger. Neste complemento men- 
cionamos brevemente a abordagem original 
de Luenberger no desenvolvimento de obser- 
vador de estados que leva seu nome. 


[m] 73 [m] 
RE 
[e 
Luenberger propôs abordar o problema 


de forma mais geral e dividi-lo em duas eta- 
pas, a saber 


1. construir um sistema que produz uma 
transformação linear do vetor de estado 
desejado: LT = Ma; 


2. garantir que M seja não singular. 


O ponto de partida de Luenberger foi apre- 
sentar e demonstrar o seguinte teorema. 


Teorema 8.4.1. Seja S4 um sistema sem 
entrada: x = Ax, que aciona um segundo 
sistema Sa: & = At + Gr. Se A e Às 
não tiverem autovalores em comum, então 
existe uma transformação linear M tal que 
se (0) = Ma(0). então & = Mã, Vi > O 
ou, de maneira mais geral 


&(t) = Me(t) + e*x(0) — Me(0)].(8.72) 


Nesse teorema 4 e B são matrizes qua- 
dradas, mas não precisam ter as mesmas di- 
mensões. A prova é simples e pode ser en- 
contrada em (Luenberger, 1964), mas o se- 
guinte desenvolvimento (usado na prova) é 
útil. Premultiplicando a equação dinâmica 
de S, por M tem-se: 


M& = MAz. (8.73) 


Usando a relação &(t) = Ma(t), pode-se es- 
crever para o segundo sistema: 


Ma = AMe+ Ga. (8.74) 


Como o lado esquerdo das equações (8.73) 
e (8.74) coincidem, igualando o lado direito, 
tem-se para um vetor a O genérico: 


MA-AM=G, (8.75) 


que é uma equação do tipo de Liapunov e tem 
solução se 4 e 4, não tiverem autovalores 
em comum (Chen, 1999), como exigido pelo 
Teorema 8.4.1. 

A seguir, Luenberger estendeu o Teo- 
rema 8.4.1 para o caso em que o sistema 
a ser observado tem entrada, ou seja, Si: 
x = Ag + Bu. Nesse caso o segundo sis- 
tema torna-se S5: à = Ag + Gar + Bou ese 
B,= MB, a Eg.8.72 é verdadeira. 

Considerando que o sistema S, tem uma 
saída, tem-se y(t) = c"x. Usando essa saída 
para acionar o sistema S, tem-se: 


z — A&+Gy+MBu, (8.7.6) 


em que se usou B; = MB para garantir a va- 
lidade de (8.72). Seguindo um procedimento 


análogo ao que levou a (8.75), chega-se a: 
MA- AsM = Ge". Como M deve ser inver- 
tível, Luenberger escolheu M = I, tal que 


A-A = Ge" 
A = A-Ge”, 
que substituído em (8.76) resulta em 
&(t) = (A- GeND(t) + Bu(t) + Gylt), 


que é a equação do observador em tempo con- 
tínuo (compare com a Eq. 8.45). 


Complemento 8.2. Observadores e Sincro- 
mismo 


Neste complemento é mostrado como o 
problema de observação de estados pode ser 
interpretado como o de sincronizar o obser- 
vador ao sistema. 


Para isso, começamos de forma um pouco 
mais geral do que na Seção 8.3. Imagina- 
mos, portanto, que o estado de um observa- 
dor linear no instante k + 1 pode ser dado 
pela combinação linear do estado, da(s) en- 
trada(s) e da(s) saída(s) no instante anterior, 
ou seja, escrevemos: 


&(k+1) = FE) + Hu(k) +Gy(k), (8.77) 


em que F, H e G são matrizes constantes de 
dimensões adequadas. Desejamos que &(k) = 
c(k), ko < k < o0, ou seja, o vetor ob- 
servado deve se aproximar do vetor de es- 
tado em tempo finito. Em (8.77), o primeiro 
termo do lado direito é o último valor do ve- 
tor observado, portanto o mesmo incorpora a 
memória do observador, que é um sistema di- 
nâmico. O segundo termo, é responsável por 
levar em conta o efeito do vetor de entradas 
e o último termo contém a informação das 
saídas do sistema. Esse último termo pode, 


portanto, ser visto como um termo de acopla- 
mento entre o sistema e o observador, pois é 
o vetor de saída y(k) que contém informação 
do sistema no instante k e que, em princípio, 
permite corrigir desvios entre o observador e 
o sistema. 


Note que o vetor de entradas u(k) é um 
conjunto de sinais externos ao sistema, o que 
justifica o uso do termo vetor de variáveis 
exógenas em alguns contextos. Uma vez de- 
terminadas as matrizes F, H e G em (8.77) 
essa equação é um observador de estado, pois 
fornece o vetor &(k) desejado. 


Um parêntesis de cunho histórico 


A fim de melhor apreciar os elementos que 
compõem a Eqg.8.77, consideremos rapida- 
mente a história do físico holandês Christian 
Huygens, a quem se atribui o primeiro relato 
do fenômeno de sincronização. 

Uma das muitas atividades de Huygens 
era a de relojoeiro. Os melhores relógios que 
construiu eram relógios de pêndulo. Conta-se 
que ao terminar de consertar ou montar um 
relógio, Huygens o dependurava em uma das 
paredes de madeira de sua residência, junta- 
mente com outros relógios. Um dia observou 
algo interessante. Ao dependurar um reló- 
gio, seu pêndulo estava assíncrono com res- 
peito aos pêndulos dos demais relógios que 
já se encontravam afixados na parede. Con- 
tudo, depois de algum tempo o pêndulo do 
último relógio passou a mover-se de maneira 
síncrona (em fase) com os demais. Qual era 
a causa desse sincronismo? 


Depois de alguns experimentos, muitos 
deles “fracassados”, Huygens percebeu que o 
sincronismo era efetuado graças às vibrações 
transmitidas pelos relógios e que eram propa- 
gadas pela parede ao relógio que havia sido 
colocado ali por último. Mesmo contendo 
pouca energia, essas vibrações eram sufici- 
entes para, aos poucos, levar o novo relógio a 
bater em sincronia com os demais. As vibra- 
ções, portanto, constituífam-se no necessário 
acoplamento entre o conjunto de relógios e 
o novo. Como visto, o vetor de saída y(k) 
em (8.77) é um termo de acoplamento entre 
o sistema S e o observador. 


Mas será que basta ter uma ação de aco- 
plamento (fraco) entre dois sistemas para que 
os mesmos passem a operar de maneira sín- 
crona? A intuição fornece uma resposta ne- 
gativa a essa indagação, pela simples razão 
de que se dois sistemas forem muito diferen- 
tes, o acoplamento disponível não será sufici- 


ente para a sincronização. No caso dos reló- 
gios de Huygens, como a dinâmica intrínseca 
dos relógios era muito próxima — ou seja, O 
período natural dos pêndulos deveria ser ne- 
cessariamente muito parecida entre os reló- 
gios — bastava um pequeno acoplamento para 
garantir a sincronização (ver Exercício 8.11). 


Podemos interpretar o problema da ob- 
servação de estados como um problema de 
sincronização. Os “relógios” neste caso são: 
o sistema S e o observador O, por enquanto 
representado pela Eq. 8.77. O termo de aco- 
plamento nessa equação é o vetor de saídas 
y(k). Pela analogia com a história de Huy- 
gens, basta agora garantir que S e O tenham 
comportamentos dinâmicos parecidos. A se- 
guir, determinamos as matrizes F e H com 
esse objetivo. 


Definição da equação básica 


Como visto anteriormente, é conveniente ga- 
rantir que a dinâmica do observador seja tão 
próxima quanto possível da do sistema a fim 
de permitir o “sincronismo” entre ambos, ou 
seja, desejamos que (8.77) se aproxime de 


av(k + 1)= Ax(k) + Bu(k), (8.78) 


de tal maneira que &(x) = a(k). Reescre- 
vendo (8.77) com &(x) = a(k) tem-se: 
&(k+1) = F&(k) + Hu(k) + GC&(k) 
= (F + GO)&(k) + Hulk), (8.79) 


que, por comparação direta com (8.78), en- 
contramos as condições para que (8.78) e (8.79) 
tenham a mesma dinâmica: 


H=B 
F+GC=A. F=A-GC. (8.80) 


Substituindo esse resultado em (8.77) e 
adicionando a equação de saída, chegamos às 


equações do observador: 
g(k +1) = (A-GO(k) +Bu(k)+Gy(k) 
ak) = Cê(ho, (8.81) 


que é igual ao resultado obtido em (8.45). 
Lembre-se que as incógnitas eram as matrizes 
F, H e G, e que somente determinamos duas 
delas. Como visto neste capítulo, G deve ser 
escolhida de tal forma que o observador não 
somente seja estável, mas também seja mais 
rápido do que o sistema sendo observado. 


Complemento 8.3. O Teorema de Cayley- 
Hamilton 


O teorema recebe os nomes do inglês 
Arthur Cayley (1821-1895) e do irlandês 
Willam Rowan Hamilton (1805-1865). Em 
1853, Hamilton verificou o teorema para qua- 
ternios e, em 1858, Cayley o provou para ma- 
trizes de ordem menor e igual a três. O caso 


geral foi provado pelo alemão Ferdinand Ge- 


org Frobenius (1849-1917) em 1878. 
Seja o polinomio característico de 4 E 


AM =M-A=M +aXcit...+aniÃ+tan. 


A(A)=|4-4|=0 
= A" tgATIs.. +oniÃtan, (8.82) 


ou seja, uma matriz satisfaz sua própria 
equação característica. De (8.82) é imedi- 
ato constatar que 4” pode ser escrita como 
uma combinação linear de (1,4, ..., AM. 
Multiplicando (8.82) por A, conclui-se que 
A"*t pode ser escrita como uma combina- 
ção linear de (4, 42, ..., A"), mas 4” pode 
ser escrita como uma combinação linear de 
(TA, ..., A. Portanto, por maior que 
seja o grau de um polinômio f(A), o polinô- 
mio matricial correspondente pode sempre 


ser expresso na forma 


FA) = BoI+BiA+...+Ba AT, (8.83) 


Complemento 8.4. Transformação para 
a Forma Controlável 


No presente complemento é derivada a 
matriz de similaridade P tal que x = Pã 
sendo que & é o vetor de estado da represen- 
tação companheira controlável (7.28). Para 
isso começa-se escrevendo a matriz de simi- 
laridade como 


P=[p,po...p,). (8.84) 


A seguir considera-se o caso de uma en- 
trada. Como b = P-!b — veja (7.13) - ou 
ainda, b = Pb e dado que b é um vetor com 
n—1 zeros e com um 1 na última posição, 
segue-se que b = p,. 


Agora que a última coluna de P foi de- 
terminada a partir de b = Pb, prossegue-se 
usando a expressão 4 = P-1AP, ou ainda 
AP = PA para determinar as demais colu- 


nas de P. 
AP = [Ap, Ap, 
PÃ=[(-aop,) 


“Ap, | 
(8.85) 


(Pj-mP,) -.. (Pai An-1Ph)]. 


Igualando as matrizes em (8.85) coluna por 
coluna, começando da última até a segunda 


tem-se: 
Po — An Pa 
Pá-o — An-2P, 


-Ap,=anb+ Ab 
Ap, 1=an-2b+A(an-1b+ Ab) 


p= ub+tazAb+... Ab. 


Portanto, a 


matriz P pode ser escrita como 


P=[b Ab... Ab AP) x 


a ag QGn-1 1 
ag as 1 O) 
x : (8.86) 
An-1 1 0 O) 
1 0 0 O) 


em que a primeira matriz componente de P 
é a matriz de controlabilidade e a segunda 
matriz é formada a partir dos coeficientes — 
a menos de ay — do polinômio característico 
de 4. Na Sec. 8.2 foi visto que P = CC-!, em 
que C é a matriz de controlabilidade nas co- 
ordenadas originais e C é a matriz de contro- 
labilidade do sistema expresso na forma com- 
panheira controlável, ou seja, do par (À, b). 
Como esse par pode ser escrito sem dificul- 
dade uma vez que se conheça o polinômio 
característico de 4, obter É é viável e, por- 
tanto, P= CC-!. Uma vantagem de (8.86) é 


não precisar inverter matrizes. 


Complemento 8.5. O Problema de Con- 
trole Ótimo 


Começamos apresentado algumas defini- 
ções. 


Definição 8.4.1. Seja x € IR” e a matriz 
simétrica M = MT E R”*”. Uma função 
J(a) está na forma quadrática se puder ser 
expressa como: 


J(x) = «Ma. 
Definição 8.4.2. A matriz simétrica M = 


M" e R"*” é definida positiva se o escalar 
q Ma > 0,Vã + 0. 


Definição 8.4.3. A matriz simétrica M = 
M” E R”*” é semidefinida positiva se o es- 
calar "Ma > 0,Vx 0. 


Exemplo 8.4.1 


Seja a matriz simétrica definida positiva 


Lol 
M=|0 a 


e a função quadrática 


Je = e iMia 


= 21+0,525. 


Minimizar a função J(a) implica a 
minimização de |x1| e de |x5|, sendo que 
|x1| é um pouco menor que |x5|, pois 
aquela variável tem peso maior do que 
esta na função J(x). Se a matriz for se- 


midefinida positiva, como 
o 
v=Lo0) 
a função quadrática correspondente é: 
J(z) = e Me=2] (8.87) 


e a minimização de J(x) implica a mini- 
mização de |x1|, mas não a de |xs|, que 
recebeu peso nulo em (8.87). 


Uma propriedade de matrizes definidas 
positivas é que todos seus autovalores são 
estritamente positivos. Por outro lado, se 
a matriz for semidefinida positiva, então ao 
menos um de seus autovalores É nulo e os 
demais, positivos. Essa propriedade pode ser 
utilizada como um critério para testar matri- 
zes. Outros critérios existem. 

O controle por alocação de polos via rea- 


limentação de estados descrito na Seção 8.2 
objetiva levar o estado do sistema à origem 
do espaço de estados, ou seja, a x = 0, que 
é o ponto de regulação. Se o sistema tiver 
que ser regulado em algum outro valor, sem 
perda de generalidade, esse outro valor pode 
ser considerado a origem de um outro con- 
junto de coordenadas. Portanto, o procedi- 
mento descrito na Seção 8.2 pode ser inter- 
pretado como um sistema de controle regula- 
tório que tem a função de minimizar a norma 
do vetor de estado x. O preço a ser pago por 
essa minimização pode vir a ser a necessidade 
de sinais de controle de grande potência, ou 
seja, entradas u “grandes”. 


Utilizando os conceitos até aqui apre- 
sentados, pode-se evitar que a entrada seja 
“crande” minimizando a norma do vetor de 
estado e, simultaneamente, penalizando va- 
lores elevados de u. Uma maneira de fazer 
isso é definir uma função de custo quadrática 


da forma 


(e,u, N)= Set JQd)x()+u” (k)R(k)u(k), (8.88) 
k=0 

em que N éfintoeQER* eReRY 
são matrizes simétricas, semidefinida posi- 
tiva e definida positiva, respectivamente. As- 
sim, como J(a,u,N) pondera de maneira 
quadrática tanto o vetor de estados como o 
vetor de entradas, ao longo do tempo dis- 
creto k, a minimização de J(x,u, N) implica 
uma minimização conjunta, de forma ótima, 
do erro de controle ao longo do tempo, re- 
presentado por ax(k), e do esforço necessário 
para atingi-lo, o que é representado pelo valor 
acumulado de u(k). Um aspecto importante 
nessa minimização é que a(k) e u(k) não são 
livres para assumirem quaisquer sequências 
de valores, pois esses vetores, sendo parte de 
um mesmo sistema dinâmico, estão relacio- 
nados. Podemos agora apresentar a definição 


do problema de controle ótimo. 


Definição 8.4.4. Seja o sistema linear 


e(k+1) = A(kja(k) + BlkJu(k) 
ylk) = C(kJx(k), (8.89) 


deseja-se determinar uma lei de controle ótima 
uº(k) = fla(k)| que minimize a função de 
custo 

N 

Jn = > 2H(6Q(k)e(k)+u” (k)R(kJu(k), (8.90) 

k=0 
em que N éfintoeQEIR"* eReRY 
são matrizes simétricas, semidefinida posi- 
tiva e definida positiva, respectivamente. 


Ao longo das décadas de 1960 e 1970 
muito esforço foi investido na solução do pro- 
blema de controle ótimo, sendo que mais de 
uma abordagem é possível. A que é breve- 
mente descrita a seguir tem como ponto fo- 
calo princípio de otimalidade de Bellman — 


conhecido também como programação diná- 
mica (Bellman, 1957) — e é a utilizada por 
outros autores (Phillips e Troy Nagle, 1995, 
Sec. 10.3). 

Uma descrição simplificada do princípio 
de otimalidade de Bellman é: se a lei de con- 
trole uº(k) = fla(k)| é ótima no intervalo 
O<k<N, ela também é ótima em qualquer 
subintervalom <k< N,sendol<m<N 
(param = 0 tem-se o intervalo original). 
Note que todos os subintervalos terminam ao 


fim do intervalo original, ou seja, em k = N. 

O princípio da otimalidade de Bellman 
pode ser utilizado na solução do problema 
de controle ótimo. O procedimento resul- 
tante é um exemplo de programação dinã- 
mica. Para entender tal procedimento, são 
necessárias algumas definições. O custo no 
instante k é: 


Fe = eMWQa(k) + uT()R(ku(k), (8.91) 


logo (veja Eg.8.90) Jn = h +HhHA+...+ 
Fna + Fy. O custo no intervalo m < k < 


N é indicado por S,, e pode ser escrito em 
termos de HF, como (ver Figura 8.21) 


N 


Sm=Jn-Jn-m= >, Fum=1,2,..,N. (8.92) 
k=N-m+1 
Jn 
- Sm > 
fo Fra 
ano, Fo? 
Fn-ma Fw 
e 
+—+—— 
0 1 N-m N-mk N-2 N-1 N k 


FIGURA 8.21: Representação esquemática 
da relação entre J,, Fy e Sp. 


O princípio da otimalidade estabelece que 
se Jn é ótimo, o mesmo é verdadeiro para 
Sm- Assim, começa-se minimizando o custo 
da última iteração, ou seja, Fw que é igual a 
S1 (ver Eq. 8.92). Chamemos o valor ótimo 
de S7. Com este valor definido, desejamos 


escolher Fw-1, de tal maneira que S5 seja 
mínimo, ou seja, procura-se o mínimo de 


N 
S= > Fr=Fna +En=Fna+S, (8.93) 
k=N-1 


que indicamos por S$, e assim sucessivamente. 
A esse procedimento é dado o nome de pro- 
gramação dinâmica. Deve ser lembrado que 
o procedimento descrito pode ser visto como 
uma sequência de problemas de otimização, 
cujas variáveis de decisão são os sinais de con- 
trole u(k). Essas variáveis, juntamente com 
as condições iniciais e o modelo (8.89), uni- 
camente determinam a(k). A partir desses 
valores tem-se F,., Sp € Jp. 

De maneira mais específica, podemos es- 
crever (ver Figura 8.21) 


O etÃ — Sim + E Nas (8.94) 


ou seja, o custo do intervalo que passa a in- 
cluir o instante N — m é o custo do inter- 
valo que inicia após esse instante (Sm) mais 


o custo desse intervalo, que é Fw -m: Usando 
a definição (8.91), (8.94) pode ser reescrita 
como 


Smi1i = Sma+e(N-mQ(N -me(N —m)+ 
FuT(N = m)R(N — mJu(N — m), (8.95) 


em que a dependência de z(N —-m) e u(N — 
m) está explícita. Portanto, faz sentido mi- 
nimizar S,m41 com relação a u(N — m), ou 
seja, utilizando u(N — m) como variáveis de 
decisão. Matematicamente, isso corresponde 
a encontrar os valores de u(N — m) que sa- 
tisfazem 


OSm+1 


o e (8.96) 


É possível mostrar que (8.96) pode ser es- 
crita na forma (Phillips e Troy Nagle, 1995, 
pp. 390,391) 


2BTP(N-m+1)42+2[BTP(N-m+1)B+R]u =0, (8.97) 


em que o argumento das matrizes B,A e R, 
e dos vetores x eu é N —m. A solução de 


(8.97) é 
uº =-[BTP(N-m+1)B+ RI!BTP(N-m+1)Ag, 


que está na forma 


u(N-m) = -K(N-mje(N—-m) (8.98) 
K(N-m) = [BIN-mP(N=-mADB(N=-m)+R(N=m)]" 1 x 
xBT(N-m)P(N-m+DA(N-—-m), 


em que P é uma matriz simétrica, que pre- 
cisa ser determinada para calcular a lei de 
controle ótima encontrada (8.98). A matriz 
P pode ser determinada usando o valor ótimo 
encontrado (8.98) em (8.95) e comparando o 
resultado com a entidade 


Sam = e (N-mP(N-me(N-m). (8.99) 


Por fim, as equações que resultam na 
sequência de controles ótimos são: 


uk) = —-K(ko(k) 
K(k) = [BT(WP(GK+ADBM+R(] BT (k)P(k+I)A(K) 
P(k) = ATGP(k+DIA(k) — B(6)K(k)] + Q(k), (8.100) 


parak = N-1,N-2,...,1,0, com as seguin- 
tes condições finais: P(N) = Q(N), K(N) = 
0, sendo Q e R “parâmetros” de sintonia do 
controlador ótimo. Normalmente tais matri- 
zes são escolhidas constantes. 


A solução apresentada em (8.100) é válida 
para sistemas lineares variantes no tempo. 
No caso de sistemas lineares invariantes no 
tempo, as matrizes A e B são constantes. Em 
ambos os casos a lei de controle é por reali- 
mentação de estados, mas, comparada à lei 
de controle usada na Seção 8.1 vê-se que a lei 
de controle ótimo requer que a matriz de ga- 
nhos seja variante no tempo. Outra observa- 
ção sobre a solução (8.100) é que a matriz de 
ganho K(k) e a matriz auxiliar P(k) são cal- 
culadas de trás para a frente, ou seja, come- 
çando em k = N até chegar em k = 0. Isso 
significa que, definido o horizonte de controle 
N, toda a sequência K(k), k = 0,1,...,N 
deve ser calculada a priori antes de começar 


a aplicar a ação de controle ao sistema. 


Exemplo 8.4.2 


Seja a equação dinâmica de um sistema 
linear e invariante no tempo 


Ea RL EE 


+ 66] ulk). (8101) 


Note que o sistema tem dois autovalo- 
res fora do círculo de raio unitário, mas 
o mesmo é completamente controlável. 
Como (8.101) está na forma canônica de 
Jordan, a controlabilidade pode ser ava- 
liada por inspeção dos elementos de B. 
Escolhendo 


g=[ e 4] ei 


podemos calcular a sequência de ganhos 
ótimos K(k) = [Ki(k) Ko(k)| para k = 
1,...,N utilizando (8.100). Os resulta- 
dos estão mostrados na Figura 8.22 para 
três horizontes de controle diferentes. 

Da Figura 8.22 é possível ver que os 
valores dos elementos da matriz de ganho 
só variam ao fim do horizonte de controle. 
Essa é uma característica de sistemas in- 
variantes no tempo. 
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FIGURA 8.22: Ganhos (a) Ki; e (b) K» 
para N = 20,35,50. Note como o ganho 
para k — O independe do horizonte de 


controle N. 


Se o sistema em (8.101) for simu- 


lado com a lei de controle ótimo u(k) 


—K(k)ae(k), sendo a sequência dos va- 
lores de K(k) determinados por (8.100), 
como ilustrado na Figura 8.22, ou se for 
controlado com a lei de controle com ga- 
nho fixo u(k) = —K(1)x(k), o resultado 
é indistinguível (veja Exercício 8.14). 


No caso de sistemas variantes no tempo, 
a matriz de ganhos K(k) tipicamente varia 
com o índice de tempo k (veja Exercício 8.15). 


Nota Histórica 


Richard Bellman foi um dos primeiros a indi- 
car que “o efeito de uma decisão [uma ação de 
controle] é uma transformação das variáveis 
de estado” (Bellman, 1957, Cap. 3), nas pala- 
vras de Kalman: “o princípio de que as entra- 
das devem ser computadas usando o estado 


foi enunciado e enfatizado por Richard Bell- 
man nos meados da década de 1950. Essa é a 
ideia fundamental do controle realimentado” 
(Kalman et al., 1969, p. 46). Em 1960, Kal- 
man expressou esse pensamento escrevendo 
u(nT) = x(e(n7),nT). A seguir, imaginou 
o caso mais simples, em que a função x é 
linear e invariante no tempo, e assim che- 
gou à lei de controle em tempo discreto da 
forma u(nT) = —Ka(nT) (Kalman, 1960). 
Foi nesse mesmo artigo que Kalman introdu- 
ziu os conceitos de controlabilidade, observa- 
bilidade e enunciou o princípio da dualidade. 
A lei de controle u(t) = —Ká(t) foi mencio- 
nada por Luenberger (Luenberger, 1964). 


Em seu artigo seminal, Luenberger não 
apenas derivou a equação do observador em 
tempo contínuo (que é análoga à de tempo 
discreto), como também discutiu o problema 
de observadores de ordem reduzida (Luen- 
berger, 1964). Ele mostrou que um sistema 


completamente observável de ordem n com p 
saídas independentes pode ter seu vetor de 
estados estimado por um observador de or- 
dem (n — p). Apesar de não citar explicita- 
mente o princípio da separação, Luenberger 
mencionou e usou os respectivos resultados. 


É comumente aceito que o princípio da 
separação foi originalmente publicado em 
(Joseph e Tou, 1961). Esse trabalho foi es- 
crito no contexto de controle ótimo e não no 
de observadores, o que foi feito por Luenber- 
ger poucos anos depois. No artigo de Joseph 
e Tou os estados são estimados por filtros de 
Kalman. O foco do artigo fica bem caracteri- 
zado na seguinte citação: “Em 1958, Kalman 
e Koepcke levantaram a questão de “se a oti- 
mização em separado da predição estatística 
e do desempenho de controle resulta em um 
sistema totalmente ótimo”. Este artigo res- 
ponde a essa pergunta de maneira afirmativa 
para uma importante classe de problemas de 


controle” (Joseph e Tou, 1961, p. 194). Nessa 
citação a menção da otimização em separado 
parece ter motivado o nome para o princípio 
da separação que estabelece que se o con- 
trolador e o estimador forem estimados de 
maneira independente, o sistema resultante 
é ótimo com respeito a um critério de otima- 
lidade quadrático. 


Leitura Recomendada 


Os livros (Ogata, 1995; Phillips e Troy Na- 
gle, 1995; Franklin et al., 1998) e (Yoneyama, 
2022) abordam o projeto de sistemas de con- 
trole em tempo discreto em espaço de esta- 
dos, inclusive tratam do projeto LOG (linear 
quadratic Gaussian), que é uma técnica de 
controle ótimo. 


Exercícios 


As seguintes perguntas dizem respeito ao 
script simrk ph teste ee e ao modelo line- 
arizado apresentado no início da Seção 7.5. 


1. Analise a controlabilidade do par 
(A, B). Note que somente os estados 
x2 (concentração de ácido) e «3 (con- 
centração de base) são usados para cal- 
cular o pH. Com isso em mente, volte 
a analisar o problema da controlabili- 


dade; 


2. projete uma lei de controle por reali- 
mentação dos estados x» e x3 tal que 
a constante de tempo associada a essas 
variáveis seja a metade da constante de 
tempo em malha aberta; 


3. valide seu projeto por meio de simu- 
lação. Compare a velocidade de res- 
posta das variáveis 73 e x3 antes e de- 


pois do controle. Leve o sistema ao 
ponto de operação e aplique uma pe- 
quena perturbação usando a vazão de 
ácido forte para isso. Lembre-se que 
a vazão de base forte é a entrada ma- 
nipulada. Faça isso em malha aberta 
e.g. como a vazão de base forte cons- 
tante e também em malha fechada em 
que essa vazão é determinada pela lei 
de controle. Compare a velocidade de 
resposta nos dois casos; 


. nas simulações do item anterior, com- 
pare a velocidade de resposta do pH; 


. no caso de se medir y=%5 + 0,513, ou 
seja, c" = [0 10,500 00], projete um 
observador com somente dois estados: 
to € 3; 


. usando o observador projetado, im- 
plemente a lei de controle projetada 


no segundo item. Usando o script 
simrk ph CD, simule o sistema proje- 
tado em malha fechada. 


8.1. As matrizes (4, B) de um sistema são: 


Rida RO 


Verifique se esse sistema é controlável e, 
em caso positivo, forneça K tal que o sis- 
tema com a lei de controle u = — Ka tenha 
autovaloresem A=01eA= 0,2. 


8.2. As matrizes de um sistema em tempo 
discreto são: 


0,4 01 -—0,2 0,2 
A=|05 0,8 0,6 |; b=| 0,3 |; e" =[631255]. 


15 —0,5 1,0 —0,2 


Com respeito a esse sistema pede-se: 


. Simule o sistema para uma entrada em 
degrau unitário, sendo que a transição 
do degrau ocorre para k = 5. O hori- 
zonte de simulação é N = 100. Nessa 
simulação, implemente a equação de es- 
tado e a de saída. Considere condições 
iniciais nulas. 


. Repita o item anterior usando o comando 
dlsim do Matlab e compare os resulta- 
dos. 


- Construa a matriz de controlabilidade 
e verifique se o par (4, b) é controlável. 
Repita o procedimento com o comando 
ctrb do Matlab. 


. Encontre o polinômio característico da 
matriz 4. 


- Construa um polinômio que tenha raí- 
zesem À = 0,7; À = 08e A = 0,9. 


Dica: use o comando poly do Matlab. 


-. Implemente a fórmula de Ackermann 
para encontrar o vetor linha de ganhos 
K de tal forma que (A — bK) tenha 
autovalores em À = 0,7; À = 08 e 
A=0,9. 


. Repita o item anterior usando o comando 
acker do Matlab. 


- Simule o sistema controlado com u(k) = 
r(k) — Kac(k), sendo r(k) um sinal nulo 

paralsk<Serkl=0,06,6<k< 

100. 


-. Determine a energia do sinal de con- 
trole como 


N=100 
Eu >, u(k)?. 
k=1 


10. Repita os itens 6 a 9 para o caso em que 
(A-bK) tenha autovalores em À = 0,7; 
A=0,8eA=0,6er(k) é um sinal nulo 
pral< ks Sertk]= 024, 6<h=< 
100. 


11. Compare as principais diferenças entre 
ambos os casos. 


8.3. Um sistema é descrito pela equação de 
diferenças: 


y(k) = —Oyy(k—1) -Ooy(k—2) +03u(k—2). 


Forneça a lei de controle tal que o sistema 
controlado tenha polos em z = 0,9ez= 0,8. 


8.4. Explique porque o sistema do Exem- 
plo 8.1.4 tem função de transferência nula. 


8.5. Mostre que a matriz de observabilidade 
de um sistema é igual à transposta da ma- 
triz de controlabilidade do respectivo sistema 


dual. 


8.6. Seja um sistema SISO descrito em es- 
paço de estados por (4,b,c”,d). Se a lei de 
controle for u(k) = Nr(k) — Ka(k), em que 
N e r(k) são escalares e K é um vetor linha 
n-dimensional e a(k) é um vetor coluna n- 
dimensional, qual é a função de transferência 
de malha fechada? 


8.7. Refaça o desenvolvimento que resultou 
na Eq. 8.47, mas suponha que as matrizes do 
observador não sejam exatamente iguais às 
do sistema, ou seja, considere A, = A+ Aq, 
Bo =B+Ape0,=C+ Ac, em que o su- 
bíndice “o” indica matrizes do observador e as 
grandezas “A” são erros aditivos. Compare 
criticamente seu resultado com o mostrado 
na Eq. 8.47. 


8.8. Refaça o desenvolvimento que resultou 
na Eq. 8.47, mas suponha que o modelo com- 
pleto (não disponível para o projeto do ob- 


servador) é dado por 


a(k+1) = Ax(k) + Bu(k) + w(k) 
ylk) = Ce(k) + v(k), 


em que w(k) representam distúrbios (entra- 
das não medidas) e v(k) correspondem a pro- 
blemas de medição. Compare criticamente 
seu resultado com o mostrado na Eq. 8.47. 


8.9. Comparando a equação característica 
do controlador por realimentação de estados 
|zI—- A+ BK| = 0 e a do observador |z1 — 
A+ GC| = 0 percebe-se clara semelhança. 
Reescreva |21 — A+ GC| = 0 de modo que 
a incógnita ocupe a mesma posição que a in- 
cógnita em |21 — A+ BK| = 0 de maneira 
que se possa usar a fórmula de Ackermann de 
controlador. Mostre que esse procedimento 
é equivalente a utilizar a fórmula de Acker- 
mann de observador (8.48). 


8.10. Um sensor virtual (ver Figura 8.23) é 
um modelo que a partir de uma ou mais va- 
riáveis (e.g. u) fornece uma estimativa (e.g. 
y) de uma ou mais variáveis que não são me- 
didas. Compare criticamente o sensor vir- 
tual da Figura 8.23 com um observador de 
estado que também tenha como objetivo for- 
necer uma estimativa 9. 


Sistema S 
Modelo M : (A,B,C) 


FIGURA 8.23: Esquema de sensor virtual. 


8.11. Se colocarmos dois violões afinados um 
de frente para o outro e tocarmos uma corda 


qualquer em um deles, apenas a corda corres- 
pondente no outro violão vibrará. Explique 
esse fenômeno com base no conceito de sin- 
cronismo e acoplamento. 


8.12. Considere as matrizes de um sistema 
em tempo discreto S com T=0s: 


0 o 5 1 
A = |-097 180 0 |,b=[|0|, 

0 0 0,95 1 
ce" = [101] 


Verifique se esse sistema é controlável e 
observável. Simule o sistema (N = 200) 
para entrada nula e condições iniciais (0) = 
[10 1/”. Use a fórmula de Ackermann para 
projetar um observador que tenha três au- 
tovalores em z = 0,9. Gere o sinal de en- 
trada u(k) = 1(k — 100), que é um degrau 
unitário atrasado de 100 instantes de amos- 
tragem. Considere que a saída do sistema 


S é medida sem ruído. Simule o sistema a 
partir de condições iniciais aleatórias, com 
o observador projetado inicializado em ou- 
tras condições iniciais aleatórias. Compare 
graficamente cada componente de ax(k) e de 
&(k). Refaça o projeto do observador colo- 
cando seus três autovalores em z = 0,5 e, 
depois, em z = 0,2. Repita o procedimento 
para o caso em que a saída do sistema S é 
medida com ruído gaussiano de média nula 
e variância unitária. Analise criticamente o 
desempenho dos três observadores projeta- 
dos no caso de dados sem e com ruído. 


8.13. Considere o sistema em tempo discreto 
S do Exercício 8.12. Seja também o seguinte 
modelo simplificado M: 


0 1 1 
Am = E E Bm = Do): 
Ca = [10 


Simule e compare a resposta de S e M. Pro- 
jete e simule um regulador em que a lei de 
controle seja u = —K& tal que os autovalo- 
res dominantes do sistema realimentado es- 
tejam em À, 2 = 0,888 + 30,173. Projete um 
observador usando o modelo M para produ- 
zir & E IR? à partir da entrada u e saída 
y do sistema S. Nas simulações use ruído 
gaussiano com média nula e desvio padrão 
0=0,1. Use o ganho do observador como pa- 
râmetro de sintonia. Se a malha estiver instá- 
vel, procure tornar o observador mais rápido. 
Discuta criticamente os resultados. Em que 
aspectos este exercício se aproxima mais de 
uma situação experimental do que o Exercí- 
cio 8.12? O que ocorre se escolher os polos 
do observador em À = 0,9? Discuta. 


8.14. Simule o sistema do Exemplo 8.4.2 
com N = 20 usando duas leis de controle: 
u(k) = —K(k)a(k), sendo a sequência dos 
valores de K(k), k = 1,...,N determinados 


por (8.100) e u(k) = —K(I)x(k), em que 
K(1) é o primeiro vetor linha de ganhos óti- 
mos da sequência acima. Compare os resul- 
tados. 


8.15. Suponha que a matriz dinâmica do 
Exemplo 8.4.2 seja 


— [2+k/2N 0 


Ah) 0 15-— k/N 


(8.102) 
Note que essa matriz é variante no tempo. 
Considere N = 35 e calcule a sequência de 
matrizes de ganho K(k), k = 1,...,,N. O 
que observou de diferente com respeito ao 
Exercício 8.14? Simule o sistema em malha 
fechada com as mesmas duas leis de controle 
utilizadas naquele exercício. Discuta os re- 
sultados. 


8.16. Verifique as equações (8.66) do obser- 
vador de ordem reduzida. Dica: lembre que 
Ym(k) = y(k). Qual é a dimensão da matriz 
G do observador reduzido? 


8.17. Mostre que a dinâmica do erro de ob- 
servação do observador filtro da Eq.8.81 é 
governada pela matriz (A — GCA). 


8.18. À substituição de K(k) na expressão 
de P(k) em (8.100) resulta em uma equação 
de diferenças em P conhecida com a equa- 
ção discreta de Riccati. Iterando tal equa- 
ção indefinidamente leva ao valor de P para 
k — —oo, pois P(k + 1) é usada para de- 
terminar P(k). Obtenha a equação discreta 
de Riccati e itere-a para o caso do Exercí- 
cio 8.14. Com o valor encontrado, use a ex- 
pressão de K(k) para obter a matriz de ga- 
nhos correspondente e compare os resultados 
à Figura 8.22. 


Capítulo 9 


Estimação de 
Parâmetros e 
Estados 


O observador de estados é um algoritmo que 
determina os estados de um sistema a par- 
tir de um modelo e de dados. O projeto de 
observadores abordado na Seção 8.3 é total- 


mente determinístico, ou seja, não leva em 
conta variáveis aleatórias usadas para carac- 
terizar incerteza nas equações de estado e 
nas medidas. O problema de estimação de 
estados no contexto estocástico foi resolvido 
por Rudolf Kalman usando um algoritmo que 
veio a ser conhecido como o filtro de Kalman. 
Assim como no caso do observador de Luen- 
berger, o filtro de Kalman requer um modelo 
matemático para o sistema. 


Um problema relacionado, porém mais 
simples, é o de estimar parâmetros de uma 
função linear nos parâmetros, como uma fun- 
ção de transferência em z a partir de um con- 
junto de dados obtidos do sistema que tem 
como modelo a referida função de transferên- 
cia. Esse problema foi resolvido ao final do 
Século 18 e início do Século 19 pelos matemá- 
ticos Carl Gauss e Adrien-Marie Legendre, 
que propuseram um procedimento que veio 
a ser conhecido como o método de mínimos 


quadrados. 

Este capítulo apresenta os algoritmos men- 
cionados acima sem a preocupação de derivar 
as expressões. Aqui é seguida a exposição 
em (Aguirre, 2015) onde pode ser encontrada 
o desenvolvimento das principais expressões. 
A Seção 9.1 motiva o problema de estimação 
de parâmetros. A Seção 9.2 apresenta o es- 
timador de mínimos quadrados. Por fim, a 
Seção 9.3 apresenta as equações do filtro de 
Kalman. 


9.1 Estimação de 
Parâmetros 


Desejamos considerar qual é o objetivo da 
estimação de parâmetros. Para fins de ar- 
gumento, suponha que estejam disponíveis 
medições de duas grandezas x e y relacio- 
nadas conforme y = f(x), em que f(:) é pa- 


rametrizada por 0, ou seja, essa função de- 
pende do um vetor de parâmetros 0, ou seja, 
y = f(x,0). O problema de estimação de 
parâmetros consiste em estimar 0 a partir de 
um conjunto de medidas de x e y, ou seja, a 


partir de (Uião, ana TN) e (yiya, faro UNF. 


Exemplo 9.1.1 


Neste exemplo usamos dados de um po- 
tenciômetro experimental mostrados na 
Figura 9.1 com cruzes. No presente caso, 
o eixo das abcissas corresponde à posição 
angular do cursor do potenciômetro, en- 
quanto o eixo das ordenadas corresponde 


à tensão de saída em volts, dividida pela 
tensão de alimentação, também em volts. 
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FIGURA 9.1: Os dados medidos são mar- 
cados com (x), e a reta ajustada usando 
regressão linear, com (—). 


A reta na Figura 9.1 é parametrizada 
pelo vetor de parâmetros [04 05]”, em que 


0, é o valor de y quando x = 0 e 05 é a in- 
clinação da reta. Os valores desses parâ- 
metros estimados diretamente dos dados 
são 0, = —1,55x 10-3 e 8 = 6,98x 104, 
A função f(-) pode ser bem aproximada 
por uma reta. Assim, chamamos de f(:) 
a função estimada, que neste caso é a reta 
yv=604+ 02. 

O objetivo da Seção 9.2 é mostrar 
como estimar os parâmetros a partir de 


dados. 


A estimação de parâmetros é uma etapa 
que sucede a escolha da função f(:). No 
exemplo acima, primeiramente definiu-se que 
f() éaretay = 01+05x, e só depois procedeu- 
se à estimação dos parâmetros 0, e 05. 

À escolha de uma aproximação de f(-) foi 
grandemente facilitada pelo fato de se tra- 
tar de uma função estática bastante simples. 
Quando f(-) for uma função dinâmica sua 


escolha não é tão simples. 

A função f (-) no Exemplo 9.1.1 é linear 
nos parâmetros 6, e 05, uma vez que tal fun- 
ção pode ser decomposta da seguinte forma 
y= [1 2][04 05)”. 


Exemplo 9.1.2 


Consideremos a situação em que apenas 
dois pontos são utilizados para estimar os 
parâmetros de uma reta. Isso é possível, 
uma vez que a equação de uma reta tem 
apenas dois parâmetros, e o uso de dois 
pontos resulta em um sistema de duas 
equações com duas incógnitas da forma 


Mo apto 
do = lhssubiir 


Tomando os pontos (z1;y) = 
(144,0; 0,098) e (x:2; 42) =(158,4; 0,109) do 


conjunto de medidas, tem-se o seguinte 
sistema de equações: 


0,098 | | 1 1440 04 
Goo o as do | 
Para determinar os parâmetros da reta é 


necessário inverter a matriz da equação 
acima. Portanto, 


01]. [ 11,00 —10,00][0,098 
92) |-0,069 0,069 |[0,109 
- [-1,200 x 1072 
ss sas 


A reta resultante é mostrada na Fi- 
gura 9.2. Nota-se que, apesar de utilizar 
apenas dois pontos, o ajuste aos dados 
ainda é aceitável. 
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FIGURA 9.2: Reta com parâmetros cal- 
culados. Dados medidos são marcados 
com cruzes, e o traço contínuo indica a 
reta y= — 1,200x 10-2+ 7,639x 10-*2. 


O uso de apenas dois pontos para deter- 
minar a reta no Exemplo 9.1.2 em geral não 
é apropriado na prática quando o nível de 
ruído nos dados for significativo, como ilus- 
trado no próximo exemplo. 


Exemplo 9.1.3 


Adicionando ruído aos dados do Exem- 
plo 9.1.2 e repetindo o procedimento, 
chega-se ao seguinte resultado: (x1,Yy + 
e1) = (144,0; 0,098 + 0,032) e (x5,y2 + 
eo) = (158,4: 0,109 + 0,005), sendo que 
e; indica o ruído. Nesse caso, tem-se o 
seguinte sistema de equações: 


0,098 +0,032 | | 1 1440 04 
0,109+0,005 | |1 1584 03 |- 


Portanto, 


eh oh o = sho; (Pos 
9» || —0,069 0,069 0,114 
“| asas tor 
“| 1,091 x 1053 


O resultado é mostrado na Figura 9.3 
e mostra que, apesar de passar por dois 
valores medidos, a reta não representa a 
tendência geral dos dados. Essa falha re- 
vela que o procedimento seguido, que é 
determinístico, não é robusto com res- 
peito ao ruído. 
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FiGURA 9.3: Reta determinada a par- 
tir de dados com ruído. Dados medidos 
com ruído estão marcados com cruzes e o 
traço é a reta y = 2,872 x 107! — 1,091 x 
108: 


Para lidar com ruído nos dados, é intui- 
tivo usar mais pontos para estimar os parâ- 
metros. Contudo, nesse caso a matriz resul- 
tante nos exemplos desta seção não é mais 


quadrada e ela não pode ser invertida. O 
método de mínimos quadrados objetiva con- 
tornar esse problema, como descrito a seguir. 


9.2 O Método de Mínimos 
Quadrados 


see see 
Ela! Ela! 
pi 


Começamos escrevendo a função cujos pa- 
râmetros se deseja estimar como: 


y=x"]0+€, (9.1) 


em que se assumiu linearidade nos parâme- 
tros. Para fins de argumento, em (9.1) foi 
assumido que se conhece o valor estimado do 


vetor de parâmetros, Oie R”, e que € é o erro 
cometido ao se explicar o valor observado y 
a partir do vetor de regressores x medido e 
de 8. 

A Eq. 9.1 é chamada de equação de re- 
gressão. Tomando N > n aplicações dessa 
equação sobre os dados e representando o re- 
sultado em forma matricial, tem-se: 


y=Xô+€, (9.2) 


sendo que é ER" é o vetor de resíduos. 
Está claro que É = y — Xô, ou seja, O 
vetor de resíduos é composto pela diferença 
entre o vetor de variáveis dependentes y e a 
estimativa desse valor a partir dos dados de 
estimação em X usando o vetor de parâme- 
tros estimado 9. É interessante que ô seja tal 
que alguma norma de É seja reduzida. Para 
tornar o procedimento mais preciso, define-se 


o somatório do quadrado dos erros 


N 
Juo(8,2")=5 EP =gE=|EIP, 


i=1 

(9.3) 
que quantifica a qualidade de ajuste de X [à 
ao vetor de dados y e que depende do valor 
estimado para o vetor de parâmetros e do 
conjunto de dados Z” utilizado. Deseja-se 
que ô seja o mínimo de Jmq. Substituindo & 
(ver Eg. 9.2) em (9.3), tem-se 


Juo =(y-X 0)"(y—X 0) 
= y'y-y"xô-ô X'y+ô XT xô. 


A fim de minimizar a função de custo 
Juq com respeito a Ô, é necessário resolver 
(0Juo/90) = 0, em que (0Juo/00) é o gra- 
diente da função de custo definida na Eq. 9.8. 


Fazendo-se isso, tem-se: 


ca =(yX)-XTyHXTX + XTX)0 


=-X'y-XTy+2X"TXO, 
Igualando-se a última equação a zero tem-se 


0=[X"x]'XTy (9.4) 
=Xly, 


em que X? indica a pseudoinversa de X, que 
existe se N > nese X tiver posto pleno. 
Por fim, para que [7 corresponda ao mínimo, 
é necessário que a matriz hessiana satisfaça 


02], 

E DN XE S: (9.5) 
90 

A Eq. 9.4 é, de fato, verdadeira, pois 2XT X 

é positiva definida por construção. Portanto, 

a Eg.9.4 é o estimador que fornece o valor 


de 6 que minimiza o somatório do quadrado 
dos erros. Resumindo, 


A 


Omo = argg min Juq 
exixy, (96) 


sendo que (argg min Juq) indica o argumento, 
pertencente ao domínio de 0, que minimiza a 
função de custo Juq. Portanto, a Eg. 9.4 é a 
solução obtida pelo método de mínimos qua- 
drados (MQ), que é igual à solução obtida 
utilizando-se a matriz pseudoinversa. 

A solução indicada em (9.6) requer que 
XT X seja não singular. Lembrando que essa 
matriz é, a menos de um fator constante, a 
matriz hessiana da função de custo e que tal 
matriz mede a curvatura dessa função, torna- 
se evidente que se Juq(0) for pouco curva 
(XT X perto de ser singular), o problema nu- 
mérico em (9.6) é malcondicionado. 

A Eq. 9.4 é também conhecida como o es- 
timador de mínimos quadrados clássico ou 


ordinário, ou estimador MQ. 


Exemplo 9.2.1 


No Exemplo 9.1.1 os parâmetros de uma 
reta foram exatamente determinados a 
partir de duas restrições obtidas dos va- 
lores medidos. Conforme visto naquele 
exemplo, a reta determinada é represen- 
tativa de toda a massa de dados (medi- 
ções). A fim de ajudar o leitor a apre- 
ciar o que está acontecendo, deve-se lem- 
brar de que “dois pontos definem unica- 
mente uma reta”. Mas na massa de dados 
considerada há 21 pontos, ou seja, cada 
subconjunto de 2 pontos define uma reta. 
De fato, o conjunto de medições pode ser 
usado para determinar 210 retas diferen- 
tes! No Exemplo 9.1.2 foram usadas a 
décima primeira e a décima segunda ob- 
servações para determinar a reta. À ra- 


zão pela qual essa reta é representativa 
de toda a massa de dados é que as 210 
retas representadas pelos dados são todas 
muito parecidas. 

No Exemplo 9.1.3 o mesmo exemplo 
foi considerado, mas após adicionar, a 
posteriori, ruído aos dados medidos. Con- 
forme verificado, os resultados com ruído 
são inconsistentes com a totalidade da 
massa de dados. Isso pode ser apreci- 
ado notando-se que a reta determinada, 
apesar de passar exatamente pela décima 
primeira e pela décima segunda observa- 
ções, não é representativa. A conclusão 
óbvia é que a presença de ruído nas me- 
dições fortemente descaracteriza algumas 
das 210 retas. Entretanto, observando- 
se os dados, ainda se percebe que existe 
uma tendência que poderia ser represen- 
tada por uma reta média. 

No presente exemplo, é utilizado o 


método MQ para estimar os dois pará- 
metros de uma reta que, em geral, repre- 
sente os dados. O primeiro passo é deter- 
minar uma função f parametrizada por 
9. Aqui não há dúvidas de que f(x) = 
04 + 05% seja uma boa função candidata. 
O segundo passo é tomar 21 aplicações 
dessa função. Note que no Exemplo 9.1.3 
foram tomadas apenas duas aplicações. 

As 21 aplicações podem ser colocadas 
em formato matricial, da seguinte forma: 
v— NO sendoyeR gene 
9 E R?*!. Usando-se a Eq. 9.4, chega-se 
à reta y = —0,9567x10"* +7,142x 10-44. 
A Figura 9.4 mostra como, de fato, a reta 
estimada por mínimos quadrados é repre- 
sentativa de toda a massa de dados, ape- 
sar da presença de ruído. 


0,15H 


0,05 + 


tensão de saída por volt de alimentação (V/V) 


“oostu 1 1 1 1 1 1 
0 50 100 150 200 250 300 
graus angulares 


FIGURA 9.4: Reta estimada a partir de 
um conjunto de pontos. (x) dados medi- 
dos e (—) reta ajustada usando o método 


MQ (mg pos 0). 


9.2.1 O caso dinâmico 


O método de MQ), descrito nesta seção, pode 
ser aplicado sempre que a função em ques- 
tão seja linear nos parâmetros. Isso é válido 
tanto para funções estáticas — como polinô- 
mios — como para modelos dinâmicos. Neste 
caso, é comum ajustar um pouco a nomen- 
clatura, o que é feito a seguir. 
Indicamos um conjunto de dados por 


2º = [u(D), y(1), o u(N), UN), (9.7) 


em que u(k) são amostras (observações) do 
sinal de entrada, e y(k), do sinal de saída. 
O objetivo no contexto deste livro é estimar 
modelos ARX (autoregressivos com entrada 
exógena): 


Ala)ylk) = BlaJulk) +elk), (9.8) 


que, a menos da variável aleatória e(k), cor- 
responde a uma função de transferência em 


z. Em (9.8), os sinais são multiplicados pelos 
polinômios no operador de atraso q !: 
A(g) = L=0q"=.u= Any, 
B(g) = bg +... +bag". 


A predição de um passo à frente do mo- 
delo (9.8) indicada por y(k|k — 1), em que 
Y(k|k — 1) indica que o valor da saída no ins- 
tante k foi determinado a partir de informa- 
ção disponível até o instante k — 1, inclu- 
sive. Assim, o erro de predição de um passo 
à frente é definido como 


E(kIk — 1,0) = y(k) — (kk — 1). (9.9) 


A função de custo em (9.3) pode ser re- 
escrita como: 


Por exemplo, para a representação ARX, 
o modelo pode ser expresso como uma regres- 
são linear 


ulk) = Poulk — 1)0 +E(k), (9.11) 
em que ,,(k—1) é um vetor com ng = dim[6] 
variáveis regressoras, compostas dos sinais y 
e u tomadas até o instante k—1, como a se- 
guir: 


blk=1) = (6-1) o. (en) (RI) 
ulk-no, 


sendo que a respectiva predição de um passo 
à frente, que pode ser expressa como: 


W(klk — 1) = prulk — 1)0. (9.12) 


Nem todas as classes de modelos podem 
ser expressos na forma da Eq. 9.12. O erro de 
predição de um passo à frente (9.9) coincide 
com o resíduo quando aquele for calculado 
sobre os dados de estimação Z”. 

O estimador que minimiza a função de 
custo (9.10) para o modelo ARX é o estima- 
dor de mínimos quadrados. Portanto, Ôuo é 
um estimador na classe dos métodos PEM — 
do inglês prediction error methods. 

Utilizando (9.8) como equação de regres- 
são ao longo dos dados Z”, resulta em um 
conjunto de equações que pode ser expresso 
em notação matricial como y = vô + É. As- 
sim, o estimador MQ pode ser representado 


como (compare com a Eq. 9.6): 


ôuo = [PTV| Ivy. (9.13) 


ei:[E] 
A 


a 
[a] 


Exemplo 9.2.2 


Os exemplos até aqui consideraram que 
a função cujos parâmetros foram estima- 
dos era uma reta, ou seja, uma função 
estática. Neste exemplo, ilustra-se a es- 
timação de parâmetros de um modelo di- 
nâmico, expresso na forma da equação de 


diferenças: 


y(k) = O,y(k—D) +0,y(k—2) + O3u(k—3)+ 


A menos da falta de uma variável ale- 
atória a Eq. 9.14 é um modelos autore- 
gressivo com entrada exógena (ARX) e 
corresponde a uma função de transferên- 
cia em z (ver Exercício 9.2). 

Aqui é ilustrada a estimação dos pa- 
râmetros de tal modelo a partir de um 
conjunto muito restrito de dados. Sejam 
eles 


y(k) = [12,2 11,8 11,6 11,6 11,8 12,2 
13,0 14,4 16,2 15,8] 
[2,50 2,50 2,50 2,50 2,50 2,23 
2 DO Dono Do Do) 


ES 
A 
ES 
NELA 

II 


O vetor de regressores é 


W(k—1) = [y(k—1) y(k—2) u(k —3) 
u(k — 1) u(k — VI, 


e gera o seguinte conjunto de restrições 
ao longo dos dados acima: 


11,6 11,6 11,8 250 250 2,50 

11,8 11,6 11,6 250 250 250 |r6 
12,2 11,8 11,6 250 250 2,50 || 6» 
13,0 |=| 122 11,8 250 223 2,50 || 03 
14,4 1340 122 250 220 223]| 04 
16,2 144 130 223 220 220 |L05 
15,8 16,2 144 220 221 2,20 


Aplicando-se (9.13), obtém-se 


01 —5,6841 
0» 9,3925 
d [=| 0,7452 
ds o AM 


ô, -8,3712 


9.2.2 Estimação recursiva 


Até o momento tem-se considerado o caso 
em que toda a massa de dados está dispo- 
nível antes de começar a estimar parâme- 
tros. Nesse caso, tendo definido a estrutura 
do modelo, monta-se a matriz de regressores 
e resolve-se o problema numérico “de uma só 
vez”, ou seja, em batelada. 

Uma situação comum na prática ocorre 
quando se tem acesso aos dados sequencial- 
mente. Ou seja, a cada período de amostra- 
gem tem-se medições correspondentes àquele 
instante. Obviamente, os dados podem ser 
armazenados e resolver o problema em bate- 
lada. Mas também é possível utilizar os da- 


dos sequencialmente para atualizar o vetor 
de parâmetros usando estimação recursiva, 
assunto discutido a seguir. A ideia central 
é atualizar o vetor de parâmetros de acordo 
com: 


9(k) = 0(k—1) — n(k)d(k), 


em que o segundo termo à direita corres- 
ponde à correção a ser feita em 9(k—1), sendo 
que m(k) indica o “tamanho” da correção e 
d(k) mostra como tal correção é distribuída 
entre os elementos de 8, uma vez que nem 
todos os elementos necessariamente precisam 
ser corrigidos da mesma maneira. 

Duas situações em que técnicas recursi- 
vas são úteis são, em primeiro lugar, a ne- 
cessidade ou conveniência de estimar os pa- 
râmetros à medida que os dados do processo 
são disponibilizados, desde que tais dados se- 
jam suficientemente ricos em informação di- 
nâmica. Isso é útil quando os parâmetros 


do processo variam lentamente em função de 
não linearidades, desgaste, falhas, dentre ou- 
tros. Em segundo lugar, tais algoritmos são 
também úteis na resolução de problemas nu- 
méricos cuja solução em batelada é difícil. 


Como se sabe (ver Eq. 9.3), o estimador 
MQ pondera de forma idêntica os erros co- 
metidos pelo modelo, em outras palavras, em 
um conjunto de dados com N = 1000, a pri- 
meira observação tem o mesmo peso que a 
milésima. Quando o sistema não varia no 
tempo, em muitos casos é razoável atribuir o 
mesmo peso a todas as observações. Entre- 
tanto, se o sistema a ser identificado varia no 
tempo, as observações mais recentes preci- 
sam ser mais influentes na estimação dos pa- 
râmetros, uma vez que elas contêm informa- 
ção mais atualizada. Assim sendo, quando o 
problema em questão é o de estimar os pa- 
râmetros de um sistema que varia no tempo, 
não basta implementar o estimador de forma 


recursiva, mas também é necessário ponderar 
de maneira diferenciada as observações dis- 
poníveis. Variação de parâmetros no tempo 
pode ocorrer por uma série de razões, tais 
como: operação em regiões diferentes para 
as quais um único modelo linear não é su- 
ficiente, envelhecimento de componentes do 


sistema, ocorrência de falhas, entre outros. 
O estimador recursivo de MQ com fator 
de esquecimento À é: 


CO PRDb 
FO) = prP(Dapa FA 
B(k) = B(k=1) + K(h) [(k) — WTÔ(R= 1]; (915) 


P(k) = : (2x 1) Dee) 


br P(k-Daby + A 


sendo que o vetor de regressores W(k—1) foi 
reescrito como 1),., uma vez que tal vetor é 
atualizado na iteração k e contém informa- 
ção até o instante k—1. Ou seja, o subíndice 
indica a iteração, ao passo que o argumento 


entre parênteses, quando usado, indica até 
que instante se refere a informação contida 
no vetor. Fazendo ÀA=1 em (9.15), obtém-se 
o estimador recursivo de mínimos quadrados. 


Exemplo 9.2.3 


2 


Neste exemplo, o estimador (9.15) é 
usado para estimar recursivamente o ga- 
nho e a constante de tempo de um pro- 
cesso térmico piloto. O processo con- 
siste de aquecedor elétrico acondicionado 
em uma caixa metálica, cuja tempera- 
tura é medida e armazenada. Semelhan- 


temente, o sinal de entrada determina o 
tempo dentro de um período de trabalho 
em que o aquecedor permanece energi- 
zado. 

Tanto o sinal de temperatura como o 
sinal de comando são expressos em va- 
lores percentuais. A Figura 9.5 mostra 
dados de entrada e saída para um teste 
realizado em malha aberta. O período de 
amostragem é T=T0s. 
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FIGURA 9.5: Dados de teste de um pro- 
cesso térmico. (a) entrada u(k), razão 
cíclica, e (b) saída y(k), temperatura. 


Antes de aplicar o estimador propri- 
amente dito, foi subtraído do sinal de 
saída o valor 29,6, e do sinal de entrada 


foi subtraído 3,355 de maneira a garantir 
que os respectivos valores em estado es- 
tacionário antes do teste começar sejam 
zero. Dada a forma da resposta e como 
se deseja estimar ganho e constante de 
tempo, utilizou-se o modelo de primeira 
ordem: 


= : 9.16 
U(s) TsS+1 O 
Como o modelo a ser estimado é 
discreto, utilizou-se a aproximação 
va [y(k+1)-y(k)/Ta, com Ta=T 
para discretizar (9.16), resultando em 
y(k)=ay(k—1)-+bu(k—1), sendo que 
a TK 
| bi 
R T 
A constante de tempo e o ganho estima- 
dos na k-ésima iteração são, respectiva- 


mente, 


a na bykTk 
Via = E , pri 
dk — 1 Ia 


Note que Ky,, aqui, representa o ganho 
do processo e não a matriz de ganho de 
Kalman, do estimador recursivo. A Fi- 
gura 9.6 mostra os resultados da estima- 
ção recursiva de 7 € Ki obtida, usando 
o estimador (9.15) com À = 0,99. 
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FIGURA 9.6: Constante de tempo e ga- 
nho recursivamente estimados a partir 
dos dados da Figura 9.5. (a) constante 
de tempo e (b) ganho. 


E possível ver que a constante de 
tempo quando o sistema esfria é maior do 


que quando aquece, uma vez que o aque- 
cimento é forçado e o resfriamento é feito 
por troca de calor (basicamente por con- 
vecção) com o meio ambiente. Também, 
devido ao efeito de saturação, o ganho do 
processo é um pouco maior para tempe- 
raturas mais baixas, conforme pode ser 
verificado após a aplicação do degrau ne- 
gativo. Usando o mesmo conjunto de 
dados para estimar um modelo discreto 
em batelada, a constante de tempo do 
mesmo é aproximadamente 998s, que, 
como esperado, corresponde a um valor 
intermediário. 

Na Figura 9.6 foi usado o fator de es- 
quecimento A=0,99. A Figura 9.7, por 
sua vez, mostra valores da constante de 
tempo estimada recursivamente para três 
valores de À. 
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FiGURA 9.7: Efeito do fator de esque- 
cimento na estimação recursiva da cons- 
tante de tempo a partir dos dados da Fi- 


gura 9.5. 


Para o caso em que o fator de esque- 
cimento é unitário, ou seja, não há es- 
quecimento, o valor de 7, após conver- 


gência está subestimado (pela Figura 9.5 
é possível perceber que no resfriamento 
a constante de tempo dominante do sis- 
tema está por volta de 1100s) além do 
fato de que a convergência é mais lenta. 
O melhor resultado, dentre os mostrados, 
é o que foi conseguido com À = 0,99, 
sendo que para À = 0,97 o estimador 
não mais converge. Isso se deve princi- 
palmente ao fato de que, após um certo 
tempo, não mais há informação dinâmica 
nos dados, uma vez que o sinal de en- 
trada é um degrau, e a informação útil 
(correspondente à transição de níveis da 
entrada) começa a ser esquecida. Vale 
a pena notar que antes do estimador co- 
meçar a divergir, 7; havia rapidamente 
convergido para um valor praticamente 
correto — observe o valor estimado no ins- 
tante indicado pela linha pontilhada ver- 
tical. 


9.3 O Filtro de Kalman em 
Tempo Discreto 


Esta seção trata do filtro de Kalman (KF, 
do inglês Kalman Filter). Esse filtro nada 
mais é do que um estimador recursivo ótimo 
que, em diversos aspectos, assemelha-se ao 
estimador apresentado na Sec.9.2. Aqui a 
nomenclatura é adaptada a fim de utilizar 
terminologia mais comumente empregada na 
área de estimação de estados. 


[=] 3% 


Assume-se que o sistema sob estudo pode 
ser descrito pelo seguinte modelo linear dis- 


creto (ver Eq. 7.6) 


a(k + 1) = Ax(k) + Bu(k) + Yw(k) 
y(k)=Ca(k) + v(k), (9.17) 


sendo w e v vetores de variáveis aleató- 
rias independentes, de média nula, que sa- 
tisfazem Elw(k)w”(k)|=Q, Elv(k)v”(k)|=R 
e Elv(i)w”(9)=0, V i,j. Além disso, 
considera-se aqui o caso invariante no tempo 
e que os processos estocásticos w(k) e v(k) 
são estacionários com distribuição gaussiana. 
No contexto de filtragem de Kalman é co- 
mum referir-se ao vetor w como sendo ruído 
de processo ou dinâmico (ou, ainda, ruído 
multiplicativo) e v como ruído de medição 
(ou ruído aditivo). O problema em ques- 
tão consiste em encontrar uma estimativa 
g(k)elR” a partir de: à) o modelo (9.17), 
li) as condições iniciais &(0) e sua matriz de 
covariância P(0), iii) a sequência das entra- 
das u(k)€IR” e iv) as medições y(k)eIR”. 


A solução ótima ao problema acima é for- 
necida pelo filtro de Kalman. Esse algoritmo 
pode ser utilizado para estimar os estados de 
um sistema ou até mesmo estimar simultane- 
amente estados e alguns parâmetros do mo- 
delo (9.17). Essa característica faz do filtro 
de Kalman um estimador muito utilizado na 
prática. 


O filtro de Kalman pode ser interpretado 
como um algoritmo de duas etapas. Na pri- 
meira, o estado atual a(k) é propagado ao 
instante seguinte, k-+1, utilizando-se o mo- 
delo (9.17). Não somente isso, é necessário 
saber como a incerteza associada com a(k) 
— isso é dado pela sua matriz de covariância 
— muda no instante seguinte. As grandezas 
propagadas são chamadas de características 
a priori, pois são obtidas antes do uso de 
informação referente ao instante k+1. Gran- 
dezas a priori são indicadas com “”” neste 
texto. Essa etapa é conhecida como a etapa 


de propagação. 

A etapa seguinte, chamada de assimila- 
ção ou de correção, ajusta o estado propa- 
gado pelo modelo e sua matriz de covariância 
usando para isso medições da saída referentes 
ao instante k-+1. Após realizar a correção, o 


novo vetor de estado e sua matriz de covari- 
ância são denominadas como sendo a poste- 


riori e são indicadas com “*”. Essas etapas 
são vistas nas equações do filtro de Kalman: 


&(k+1)- =A&(k)t+Bu(k) 
P(kADT=AP(k)TAT + LQTT 
K(k+D)=P(k+1)-CTICP(k+1)-CT+R]D! 


E(k+Dt=2(k+1D) + 
EK (k+1) [y(k+1)—-C&(k+1)7] 


P(kHID)*=P(k+D) —K(kHDCP(k+)-. 


(9.18) 


Para inicializar o filtro de Kalman usa- 
se &(0)* e P(0)*. Como, em geral, não se 
tem uma estimativa do vetor de estado no 
instante inicial, esse pode ser arbitrário e es- 
colhendo um valor elevado para P(0)* o que 


reflete a pouca confiança — ou elevada incer- 
teza — associada a &(0)*. 


Portanto, as primeiras duas equações em 
(9.18) correspondem à etapa de propagação. 
Em particular, na primeira equação, o mo- 
delo, indicado pelas matrizes A e B é usado 
para propagar a melhor estimativa que se 
tem do estado no instante k, &(k)* e o co- 
nhecimento dos sinais de entrada em u(k) 
para determinar a estimativa a priori no ins- 
tante seguinte, ou seja, &(k-+1)”. Nessa pro- 
pagação não se usa a parte estocástica do 
modelo Yw(k), pois sua esperança matemá- 
tica é nula. A segunda equação indica o que 
ocorre com a incerteza associada à estimativa 
do estado após a propagação. Sem entrar em 
detalhes, nota-se apenas que a incerteza so- 
bre o estado antes da propagação P(k)* de- 
pende do modelo — matriz A — usado para 
propagar e a parte estocástica do modelo. 
Além disso nota-se que a parte estocástica, 


como esperado, contribui aumentando a in- 
certeza. À lógica por trás disso é que ao se 
propagar o vetor de estado usando um mo- 
delo incerto, a incerteza associada ao estado 
tende a aumentar. 


As três últimas equações compõem a etapa 
de assimilação, ou correção. O ajuste efe- 
tuado no vetor de estado é visto na quarta 
equação, a saber, a estimativa a posteriori é 
igual à estimativa a priori mais uma correção 
que é proporcional ao erro cometido pelo mo- 
delo — agora representado pela matriz CU — ao 
mapear o estado para a saída. Para calcular 
esse erro, que é a parcela dentro dos colche- 
tes e que é conhecida por inovação, é neces- 
sário usar dados medidos: y(k-+1). Assim, 
os termos a priori e a posteriori referem-se a 
grandezas calculadas antes e depois, respec- 
tivamente, do uso das medições y(k+1). A 
última equação indica que a incerteza carac- 
terizada pela matriz de covariância a poste- 


riori é menor que a incerteza a priori, O que 
faz sentido, uma vez que o uso de medições 
tendem a reduzir a incerteza em geral. 

A terceira equação do algoritmo é aquela 
em que se calcular o ganho de Kalman, que 
é o fator de proporcionalidade usado para 
corrigir a estimativa do estado a posteriori. 
Note que a parcela multiplicada pelo ganho 
de Kalman é a inovação. 


E comum encontrar outra nomenclatura 
associada ao filtro de Kalman: 


e(kHI) = (kk); e(kAD* = e(k4AJk+I) 
À P(k+D)O = P(k4 dk); PAD? = P(RAAIKA OD), 


em que x(k+1|k) indica o valor de x no ins- 
tante k+1 dada a informação disponível até 
o instante k, ou seja, trata-se de um valor 
a priori. Os valores a posteriori têm no ar- 
gumento a indicação k-+1|k+1, ou seja, é o 
valor da grandeza no instante k+1 incluindo 
informação nesse instante. 


A prática da filtragem de Kalman, como 
em tantos outros casos, tem suas sutilezas, 
tais como formas de fatoração matricial nu- 
mericamente mais adequadas, questões de ini- 
cialização, dentre outras. Alguns desses as- 
pectos e diversos conselhos de ordem prática 
podem ser encontrados em (Rios Neto e He- 
merly, 2007). 


Exemplo 9.3.1 


As matrizes do modelo nominal de um 


sistema em tempo discreto são: 


0,8 0,1 0,005 
de ir 
USO SOR) 
1 0,05 0,0025 
= MD o mf 
0 0 1 
=111), 
eY = 1, ou seja, uma matriz identi- 


dade de dimensão três. Para gerar da- 
dos a equação de estado e a equação 
de saída correspondente foram simuladas 
com três entradas aleatórias não corre- 
lacionadas entre si, com média nula to- 
mada de uma distribuição uniforme en- 
tre -0,5 e 0,5, ou seja u = U|[-0,5, 0,5]. 
Para cada entrada, trezentos valores fo- 
ram usados. Trezentos valores para cada 


elemento do vetor de ruído de processo 
foram tomados de uma distribuição nor- 
mal com média nula e variância 0,22, ou 
seja w - N(0, 0,22) e para o ruído de 
medição v = N(0, 0,52). Para iniciar a 
simulação foi usado um vetor de condi- 
ções iniciais aleatório a(0) = N/(0, 0,12) 
e P(0)*=1001.. 

Após simular o modelo nominal acima, 


somente a saída é utilizada para alimen- 


tar o filtro. Além disso o filtro foi as 
plementado com matrizes um pouco 


ferentes daquelas utilizadas para gerar os 
dados para tornar a simulação um pouco 
mais realista. Assim, as matrizes usadas 
para implementar o filtro foram: 


0,8 + à 0,1 0,005 
0 0 0,9 + 6 
1 0,05+6  0,0025 
Bm = |0 1 0,05 + à 
0 0 1+ó 
ci = [10,909], 


em que 3 N(0, 0,12). O filtro é imple- 
mentado com TY=h, Q=101; e R=0,1. 
Uma realização típica do filtro fornece as 
estimativas indicadas na Figura 9.8. 
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FIGURA 9.8: Traço contínuo (preto): va- 
riáveis de estados do modelo nominal; 
pontilhado (azul) valores estimados. 


A escolha de Q e R foi arbitrada e 
essa escolha deve ser vista como a sinto- 
nia do filtro. Os valores absolutos usa- 


dos não são tão relevantes quanto o valor 
relativo entre Q e R. A escolha acima 
retrata que o modelo é bem mais incerto 
que a medição. 


9.3.1 Estimação conjunta de 
estados e parâmetros 


O filtro de Kalman pode ser utilizado para es- 
timar simultaneamente tanto estados, como 
parâmetros. Para esse fim, é necessário supor 
que a variação de parâmetros é nula ou muito 
mais lenta do que a variação dos estados. 
Tal suposição permite eliminar a necessidade 
de um modelo para a propagação de pará- 
metros. Portanto, na etapa de propagação 
de parâmetros assume-se simplesmente que 
O(k + 1) = 6(k) + p(k), em que p(k) é uma 
variável aleatória com distribuição gaussiana, 
não correlacionada com a variável v(k). As- 
sim, a etapa de propagação se dá de acordo 


com: 


[8 e]IBBET+[P o 


AGR) + B(k)“u(k), (9.20) 
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em que o * indica as grandezas aumentadas, 
em função da inclusão de parâmetros no ve- 
tor a estimar. Note que como possivelmente 
alguns elementos de A e de B são estima- 
dos também — esses elementos compõem o 
vetor 0(k) — essas matrizes não são constan- 
tes. Ao tornar parâmetros do modelo estados 
aumentados, o problema torna-se não linear, 
pois as matrizes do modelo passam a depen- 
der de estados. Uma maneira de lidar com 
o caso não linear é usar o filtro de Kalman 
estendido, descrito brevemente a seguir. 


9.3.2 O filtro de 
Kalman estendido 


O filtro de Kalman assume que o sistema é 
linear. Isso permite usar uma expressão co- 
nhecida para propagar a covariância, sendo 
que o vetor de estado estimado — a média — é 
propagado usando o modelo. Em sistemas li- 
neares, as distribuições a priori e a posteriori 
são gaussianas e, portanto, são totalmente 
caracterizadas por suas médias e matrizes de 
covariância. 


No caso não linear, nem a propagação 
pode ser feita por um único modelo li- 
near, nem é realista considerar gaussiani- 
dade. Desde que se conheça o modelo não 
linear do sistema, o vetor de estado pode ser 
propagado utilizando-se tal modelo. Entre- 
tanto, como a distribuição não é gaussiana 
não é adequado usar a expressão do filtro li- 
near para propagar a covariância. 


Uma solução “clássica” para esse problema 
é o filtro de Kalman estendido (EKF, do in- 
glês Extended Kalman Filter) em que se line- 
ariza analiticamente o modelo do sistema em 
torno do estado atual e são usadas as equa- 
ções do filtro de Kalman linear, como indi- 
cado a seguir. 

É considerado que o sistema é não linear 
e descrito por (compare com a Eq. 9.17): 


o Ha(k),u(k), w(b) (9.99) 


leite lei) VI 


em que f e h são as funções não lineares 
do sistema (processo) e de medição, respec- 
tivamente. Conhecidas essas funções, o mo- 
delo (9.21) pode ser utilizado para propagar, 
tanto o vetor de estado x, quanto o vetor de 
saída y. Como mencionado anteriormente, 
o problema é que no caso não linear não há 
expressões fechadas para determinar as ma- 
trizes de covariância associadas. 


O filtro de Kalman estendido (EKF) é o 
próprio filtro de Kalman implementado uti- 
lizando as matrizes jacobianas de f e h, ou 
seja, utilizando as linearizações (primeiros ter- 
mos na expansão da série de Taylor) de tais 
funções em torno do estado atual. 

Como f e h normalmente são funções ve- 
toriais, indicamos por f; a i-ésima compo- 
nente de f. Portanto, a matriz jacobiana de 
f é definida como: 


9h 9h of 
dx, Ox, º' Oxn 
Di(lr)=| : 2... : |, (9.22) 
On  9fn 9fn 
dx1 dxa Ce o dxn 


sendo que uma matriz análoga, mas com res- 
peito ao vetor de ruído de processo, w, é de- 
finida como: 


9h 9h 9h 

dw1 wa “Cc dwn 
Df(w)= [| 220.0: 1.(9.23) 

Ofn  Ofn Im 


dw1 wa “CC dwn 


Portanto, se w; só afeta a i-ésima equação, 
a matriz Df(w) é diagonal. Possivelmente 
esse é o caso mais comum, ou seja, quando 
se associa uma incerteza independente para 
cada equação do modelo. 


A matriz jacobiana de A é definida de ma- 
neira análoga. Ao contrário do que acontece 
em sistemas lineares, para sistemas não line- 
ares a matriz jacobiana Df(x) não é cons- 
tante. Entretanto, se Df(x) e Dh(x) forem 
avaliadas em valores específicos do vetor de 
estado, «a = xo, as respectivas matrizes jaco- 
bianas passam a ser constantes. Nesse caso, 
a interpretação é que Df(xo) e Dh(x,) são as 
linearizações de f e h em torno de x = xo. 


Procedendo dessa maneira, o filtro de Kal- 
man estendido, no caso discreto, pode ser es- 


crito como 
&(k+HI)T = f(&(k)*,u(k)) 
P(k+I)T = DIC P(R)MDIT)T ADI" QDIV)T 
K(k+1) = P(k+1)- (DAT)TIDA? P(k+I) (DAT)T+ 
+DAY R(DAV)T]-! 
EAD =D) AR (RA) [y(RAD)—h(& (+) 


Pia = Pr — KesaiDh(gry)P ça 


(9.24) 


em que a seguinte nomenclatura mais 
compacta foi usada para representar as 
matrizes jacobianas: DfT=Df(x(k)), 
DI”"=DFf(w(k),  DhT=Dh(a(k+1)) e 
Dh'=Dh(v(k+1)). Essas matrizes são 
avaliadas da seguinte maneira: 


DI =Dy(e(k  e=(e0m)+, (8,0) 
DP =Df(w(k E =(de(k) +, U(k),0) 
Dn? =Dh(a DURA ae que)=áe(+1)- 
Dhº=Dh(v(k+1)) leque n)=E (+) 


Não é incomum Df” e DA” — quando não 
dependerem do estado — serem matrizes iden- 


tidade com dimensões adequadas. Deve ser 
notado como no EKF as funções não line- 
ares f e h são utilizadas, respectivamente, 
na primeira equação de (9.24) — propagação 
do vetor de estado — e na quarta equação 
de (9.24), para determinar a saída esperada, 
dado o vetor de estado propagado e a função 
h. Nas demais equações as matrizes jacobia- 
nas de f e de h foram utilizadas para deter- 
minar as matrizes de covariância e o ganho 
de Kalman. 


Exemplo 9.3.2 


Seja o modelo nominal de um sistema em 


tempo discreto descrito pelas matrizes: 


0,8 04 0,2 
A = O 03 —0,5 


0 0 0,5 
0 0 
JE) = 0706 
0,5 0 


ne pa 0,5 | 


eY = 1,ver (9.17). Para gerar dados 
o modelo foi simulado com as seguintes 
entradas: 


E 


em que v(k) — N(0,12) é uma variável 
aleatória com distribuição gaussiana de 
média zero e variância unitária. Na simu- 
lação foi acrescentado ruído nas equações 
de estado, w — N(0, 0,22), e também na 
equação de saída, v  N'(0, 0,052), como 
indicado em (9.17). Na simulação todas 


as condições iniciais foram consideradas 
nulas. 

Uma vez gerados os dados, fazemos 
de conta que não conhecemos os parâ- 
metros em negrito do modelo. Estimar 
as variáveis de estado e esses parâmetros 


é o desafio deste exemplo. 
O primeiro passo é estender o vetor 


de variáveis de estado. Além das três va- 
riáveis de estado do modelo nominal, os 


parâmetros a estimar passam a ser in- 
cluídos no vetor de estado estendido, ver 
(9.20): 


ae*=[2) 72 23 014 09], 


sendo 0,4=0,8=x4 e 0,=0,5=15. Com es- 
sas definições, as equações de estado pas- 


c(k+I) = axa(k)xi(k)—0,4x5(k)+0,203(k)+wa (k) 
co(k+1) = 0,3x2(k)-0,523(k)—0,6us (k)+wo(k) 
ta(k+1) = 0,5x3(k) tas (k)ua (k) wa (k) 
va(k+I) = xa(k)+wa(k) 

as(k+I) = xs(k)tws(k), 


em que a não linearidade — produto entre 
variáveis de estado — está explícito, razão 
pela qual usa-se o filtro estendido de MQ. 
Observe que as duas últimas equações in- 
dicam que na etapa de propagação, que 
não inclui o ruído, os parâmetros se man- 
tém constante. 

Para a implementação do filtro esten- 
dido de Kalman, o primeiro passo é en- 
contrar as matrizes jacobianas. Começa- 
mos com a matriz jacobiana do campo 
vetorial com respeito às variáveis de es- 


tado, ver (9.22): 


ga UA 


0 
0 03 05 000 
Do o os |) 
o O o a; 

0 0 o 


Para iniciar o filtro, xy e x, em DfZ fo- 
ram inicializados com valores aleatórios 
tomados de uma distribuição uniforme 
entre zero e um, ou seja, U(0,1). A ma- 
triz jacobiana do campo vetorial em re- 
lação ao ruído w, ver (9.23), é simples- 
mente Df“=T.. Como a a de saída 
h é linear, Dh?=C e DA'=L. Por fim 
é necessário definir as matrizes de cova- 
riância do ruído de estado e do ruído de 


medição: 


Q = diag[0,2 0,2 0,2 0,02 0,02] 
R= diag[0,05 0,05], 


valores esses que foram arbitrados. Aqui 
os valores relativos são mais importantes 
que os valores absolutos. Por exemplo, 
comparando os dois últimos valores de Q 
aos primeiros três indica que atribuímos 
menor variância às estimativas dos parâ- 
metros do que às das variáveis de estado. 
Também, como os valores de R são meno- 
res que os três primeiros de Q, isso indica 
que atribuímos maior confiança às “me- 
dições” do que ao modelo. O efeito de 
mudar esses valores pode ser apreciado 
por simulação. Lembre-se que a escolha 
de Q e R corresponde à sintonia do filtro. 

Para iniciar a simulação foi usado 
um vetor de condições iniciais aleatório 


2*(0)=0 e P(0)*=10075. 

A Figura 9.9 mostra o resultado da 
estimativa dos parâmetros para uma de- 
terminada realização do filtro. Esse re- 
sultado foi escolhido porque a média dos 
valores estimados está bastante próxima 
dos valores nominais utilizados para ge- 
rar os dados. 


FIGURA 9.9: Parâmetros estimados pelo 
filtro. Os valores nominais estão indica- 
dos por uma fina reta horizontal e são 
x4=0,8 e 75=0,5. A média dos valores 
estimados é: (t,)=0,89 e (%5)=0,48, em 
que (:) indica a média temporal. 


Semelhantemente, foi escolhida uma 
realização em que os valores estimados 
ficaram mais longe dos valores nominais. 
Esse caso está mostrado na Figura 9.10. 

A estimativa das variáveis de estado 


— que não estão mostradas — em to- 
dos os casos deste exemplo estão muito 
próximas dos valores correspondentes 
no modelo usado para gerar os dados. 
A estimativas das variáveis de estado, 
£;, 1=1,23, dependem dos parâmetros 
estimados Z;, 1=4,5. Além disso, as saí- 
das estimadas, %;, i=1,2, por sua vez, de- 
pendem de %;, i=1,...,5. A Figura 9.11 
mostra as saídas estimadas para o caso 
da Figura 9.9. As saídas estimadas es- 
tão praticamente superpostas às nomi- 
nais. Para o caso da Figura 9.10, o re- 
sultado é praticamente o mesmo e não é 
mostrado. A explicação para esse cenário 
é que o filtro encontrou um par de valo- 
res de Z;, 14,5 tais que, no conjunto, 
alcançam um bom desempenho. Dito de 
outra forma, em se tratando de um caso 
não linear em que o filtro minimiza uma 
função de custo do quadrado do erro, o 


filtro atingiu mínimos locais, com valores 
parecidos. Deve ser notado que, na prá- 
tica, em geral não se conhecem os valores 
nominais de parâmetros do modelo, mas 
as saídas são medidas. Portanto, aquilo 
que é verificável na prática indica o bom 
funcionamento do filtro em ambos os ca- 
sos. 
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FigurA 9.10: Parâmetros estimados 
pelo filtro. Os valores nominais estão in- 
dicados por uma fina reta horizontal e 
são x4=0,8 e x5=0,5. A média dos valo- 
res estimados é: (%4)=0,59 e (%5)=0,29. 
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FIGURA 9.11: Saídas estimadas pelo fil- 
tro. Em cada gráfico há dois traços, 
praticamente superpostos. Estes gráficos 
correspondem ao caso da Figura 9.9. Os 
gráficos correspondentes ao caso da Fi- 
gura 9.10 são praticamente indistinguí- 
veis a estes e não são mostrados. 


Nota Histórica 


Algo sobre Gauss/Legendre e Kalman. Um 
dos matemáticos mais impressionantes foi o 


alemão Carl Friederich Gauss (1777-1885) 
que reivindicava ter inventado e usado o mé- 
todo de mínimos quadrados pela primeira vez 
em 1795, quando tinha (apenas) em torno 
de 18 anos de idade. Muitas incertezas pai- 
ram sobre a origem do método de mínimos 
quadrados. Por exemplo, historiadores da 
ciência não conseguem reproduzir os resul- 
tados publicados por Gauss que alegava ter 
obtido pelo seu método (o de mínimos qua- 
drados). Contudo, como Gauss não mostrou 
a equação de regressão utilizada, mas ape- 
nas a equação não linear original, persiste a 
dúvida se as diferenças entre os resultados 
publicados por Gauss e os obtidos pelos his- 
toriadores se devem ao método de mínimos 
quadrados ou ao procedimento de lineariza- 
ção seguido. 


Uma outra importante incerteza sobre as 
origens do método de mínimos quadrados diz 
respeito ao matemático francês Adrien-Marie 


Legendre (1752-1833). A razão da incerteza 
é que Gauss somente publicou o método em 
1809, em seu livro Theoria Motus Corporum 
Coelestium, sendo que três anos antes, em 
1806, o método de mínimos quadrados apa- 
receu descrito no livro de Legendre Nouvelles 
Méthodes pour la determination des orbites 
des comeêtes. 

Quando Legendre leu no livro de Gauss 
que este reivindicava a autoria do método, 
escreveu (Sorenson, 1970): 


“Gauss, que já era tão rico em 
descobertas, poderia ter tido a de- 
cência de não se apropriar do mé- 
todo de mínimos quadrados.” 


Mesmo havendo quem acredite que Le- 
gendre já havia desenvolvido o método de 
mínimos quadrados antes que Gauss (Eves, 
2004), há um certo consenso entre os histori- 
adores de atribuir a Gauss a prioridade sobre 


tal método (Sorenson, 1970). Contudo, per- 
manece o fato de que a primeira descrição 
clara, com exemplos, e que motivou o uso do 
método foi publicada por Legendre em 1806 
(Stigler, 1986, p. 13). 


Leitura Recomendada 


O conteúdo do presente capítulo é apresen- 
tado com detalhes em muitos livros por se 
tratar de temas clássicos. Em português o 
leitor pode consultar (Hemerly, 2000; Rios 
Neto e Hemerly, 2007; Aguirre, 2015). 

O filtro de Kalman pode ser derivado de 
diversas maneiras. Neste capítulo esse algo- 
ritmo foi apresentado pronto. Leitores in- 
teressados no desenvolvimento podem con- 
sultar (Maybeck, 1979; Crassidis e Junkins, 
2004). A versão para tempo discreto foi pu- 
blicado em (Kalman, 1960), sendo que a ver- 
são para tempo contínuo foi investigada em 


(Kalman e Bucy, 1961). Uma referência muito 
bem avaliada sobre esse assunto, que inclui a 
estimação de estados para sistemas não line- 
ares é (Simon, 2006). 

O filtro estendido de Kalman foi primeira- 
mente propost por Stanley F. Schmidt (1926- 
2015), que na década de 1950 e início da 
década de 1960 era chefe de um dos seto- 
res da NASA e amigo de Kalman (Simon, 
2006, pp. 400, 487). O procedimento conce- 
bido por Schmidt foi o de linearizar analitica- 
mente analiticamente o modelo não linear em 
torno do estado atual e aplicar as equações 
do filtro de Kalman (Jazwinski, 1970). 


Exercícios 


Com respeito ao script simrk ph teste pede- 
se: 


1. gere dados por simulação usando entra- 


das em degrau e estime modelos ARX 
a partir dos dados; 


. valide os modelos estimados usando ou- 
tro conjunto de dados, como por exem- 
plo, um degrau na direção oposta, ou 
de amplitude diferente, mas tomando 
o cuidado de realizar o teste no mesmo 
ponto de operação; 


. repita a validação do item anterior, mas 
em ponto de operação diferente. Com- 
pare e discuta os resultados deste item 
frente aos do item anterior; 


. como compara os modelos estimados 
com aqueles fornecidos no código? 


. Usando os mesmos dados do primeiro 
item, implemente o estimador recursivo 
de MQ, com ÀA=1. Verifique para que 
valores os parâmetros estimados con- 


vergem e compare-os com os modelos 
obtidos em batelada. 


9.1. Seja a seguinte função de transferência: 


= biz + bygo? 
Agel q 


H(2) 


Considere a variável 2! como representativa 
do operador de atraso. Mostre como estimar 
os parâmetros do modelo acima pelo método 
de mínimos quadrados. Escreva a equação 
normal e mostre o conteúdo de cada vetor 
e matriz. Indique as dimensões de tais ele- 
mentos para o caso de estar disponível para 
a identificação uma massa de dados com N 
pares de observações. 


9.2. Derive a função de transferência em z 
correspondente ao modelo em (9.14). 


9.3. Determine por simulação a saída da fun- 
ção de transferência 


s+1 
(s + 2)(s + 4) 


para uma entrada aleatória, com distribui- 
ção uniforme, média nula e variância perto 
de um. Adicione ao sinal de saída simulado 
um ruído aleatório gaussiano de média nula e 
variância em torno de 0,02. Simule o sistema 
com um tempo de integração 0,=0,02. Use o 
estimador MQ para achar os parâmetros de 
um modelo com a seguinte estrutura 


H(s) = 


biz + bo 


H = , 
e) 22 + 2 + aq 


Compare o desempenho do modelo estimado 
frente ao modelo que produziu os dados. Sabe- 
se que nesta situação o estimador MQ é ten- 
dencioso, mas não se espera que isso seja um 
problema aqui. 


9.4. Seja o modelo ARX 


ylk) = L5y(k-D-0,7y(k—2)+ 


a) 


d) 


+u(k—-1D)+0,5 u(k—2)+e(k). 


Simule o modelo sem o ruído e(k) para 
uma entrada aleatória com 500 valo- 
res. Considere as condições iniciais nu- 


las y(l) = y(2) = 0. 


Usando os sinais resultantes do item 
anterior, estime os parâmetros resol- 
vendo o problema “quadrado” (n = N). 
Utilize as restrições k = 5,6,7,e 8 e 
também para k = 205, 206, 207, e 208. 
Compare e discorra sobre os resultados. 


Volte ao item (a) e simule o modelo 
com ruído branco, gaussiano, média 
nula e desvio padrão aproximadamente 
10% do valor do desvio padrão de y(k). 


Refaça o item (b). 


e) Estime os parâmetros utilizando o esti- 


mador MQ. 


f) Compare e discuta os resultados. 


9.5. O código que roda o Exemplo 9.3.2 pode 
ser obtido em: 


Varie os valores atribuídos a Q e R e des- 
creva as principais diferenças observadas. 
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sobreposição espectral, 78 
subespaço 
controlável, 809 
não controlável, 809 


teorema 


da amostragem, 78 
do valor final, 176, 289, 
503 
do valor inicial, 176 
teorema da amostragem, 91, 
155 
tipo do sistema, 401, 451, 504, 
507, 513, 582, 858, 
867, 870 
tranformação bilinear, 212 
transformação 
bilinear, 243, 360 
transformação bilinear, 214, 361 
transformação de similaridade, 
673 
transformada 
Z modificada, 227 
Z modificada, definição, 
229 
transformada Z, 164 
transformada de Fourier, 48 
trapézio, regra do, 214 
Tustin, método de, 214 


valores característicos, 681 
variáveis de estado, 665 


zeros no infinito, 459, 493 
ZOH 
com atraso, 291 
função de transferência, 
102 


resposta ao impulso, 101 
resposta em frequência, 
106 


Resolução e 
respostas de 
exercícios 

selecionados 


Capítulo 2 


2.8. 
efs = eT(o+iw) Es, TO çiTo 
TT] = Je7º| >1 
To > 0..0>0,poisT>0 => Re(sh> 0. 


Seguindo procedimento análogo chega-se 


jeto) = jerieo >1 


IM(a+to)| > 0. Refsk> —a. 


2.10. 


M*(s) = rm +ra 
N a 1 
AAta)t-e-T(s—A) a 
a 1 
MA +a)1-e-T(s—A) 
1 1 
1-eTs 1-e-Tís+a) 


+ (Ara) 


A=-—a 


= eTs 
= 


a e Ta) 
= eT(sta) É 


2.11. 


M (s) E 1-e Ts E 1-eT(s+1) 

2.13. 
eTssen8T 

MM” = 
(a) (s) 1-2e-TscosB6T 4 e-2Ts 

. 7 (1 = Ebert 
(b) :M (s) = (1 EE e05s)(1 as e O5(s+1))] 
2.14. 
Note que neste caso, o polo em s = —1 tem 


multiplicidade m = 2, portanto: 


ai AE ERAM! = to d(-e Tela) 
é [1 — ES Tha» 
Te Tera 


[1 — e-TE-NP" 


Logo o resíduo é: 


1 Te TseTA 
= Fa)? 
DO a) [Se TOR 
o Te TseTa 
[1 = et sta)a" 
Capítulo 3 
3.1. 
s=1 
M(z) = = 
Z—4 
M(z) = EE 
(9.26) 
é LR 
d) 
82 — 19 
Mi. = WEsapcõa) 
19 3 5 
m(k) = q O(A (5% + 53) 1(k) 


z(22? — 1124 12) 


MO E DGE Ds 
o k(k — 1) Rom 
m(k) ( dd 2k a 32t) 1(k) 
£) 
E 22(32 + 17) 
a) (2 — D)(z2 — 62 + 25) 
m(k) = (2 + 3,2(5)* cos(0,927k — 2,246)) 1(k). 
BS 
A divisão polinomial resulta em: Õ, 22 e 
Ep Portanto tem-se m(0) = |, m(1) = 


=> em(2) = E Para encontrar a expressão 
pelo método dos resíduos, note que M (2)z'"1, 
para k = 0, tem dois polos: z = —b/a e 
z=0. Parak > 0, M(z)2*! tem polo so- 
mente em z = —b/a. Para k = 0, os resíduos 
são: ro=0, paraopoloemz=0er =1/a, 


para o polo em z = —b/a. Para k > 0, o resí- 
pao j —b)k 

duo no único polo é 73 = a Neste caso, 19 

também fornece o resultado encontrado para 


k = 0. 
3.9. 


Por divisão longa é imediato mostrar que Do 
é o coeficiente do termo em 2º do quociente, 
portanto Do corresponde ao valor de d(k) no 
instante inicial, k = 0. 

Para encontrar a forma fechada da solu- 
ção é necessário tomar a transformada in- 
versa Z de D(z), para isso procedemos à de- 
composição em frações parciais: 

ie e Ca 

É (z—a) (2-1) 

o que resulta em 4 — Dot eC = Bfi. Por 
fim, consultando a tabela de transformada Z 
obtém-se a expressão procurada; 


Di-B, B 


i io 


d(k) 


A última expressão também pode ser usada 
para confirmar que d(0) = Do. A fim de 
encontrar o valor de B tal que a dívida seja 
saldada em N anos, basta usar(9.27) para 
calcular d(N), igualar o resultado a zero e 


resolver para B, o que resulta em 
Doi 
B=—————— N >0. 
1-(1+09)N 


3.10. 


A decomposição em frações parciais é 


4 —32 +42 


Eig= (2 —1) | (22 — 2 +1) 


A transformada inversa é 


4-3 cos Li | 


m(k) = | z sen eai didi 
0, k<o. 


3.11. 
A transformada inversa é 
m(kT) = m+ro 
eTUEHDT 
(1— e)? 
k EE 
1 => eTIT (1 2 A 


Ti = 


To = 


em que r; é resíduo no polo simples em z = 


e “Te r» é o resíduo no polo duplo em z = 1. 


3.14. 


A representação é realizada com a trans- 
formada Z modificada e m=0,5 (por quê?), 
ou seja, 


= (1 e DO E] er ate emar 


Zz— ecaT 


CAgs) 2 


b) 


con = Le P=QL. 


Capítulo 4 


4.9 


A resposta ao degrau unitário é: c(kT) = 


I+(eT Def k=1,2,...ec(0)=0. 


4.10 


Capítulo 5 


5.1 
Item (a). As equações principais são: 
E(s) = R(s) — H(s)G(s)X“(s) 
X(s) = D(s)E(s) — G(s)X*(s) 
C(s) G(s)X*(s), 


em que a variável E(s) está na entrada do 
primeiro amostrador, e X(s) na entrada do 
segundo. Tomando a transformada estrela 
tem-se 


Cs) = G'(s)X(s), 

Resolvendo esse sistema de equações chega- 
se a 

C*(s) D*(s)G*(s) 

PR(s) 1+G(5)+ D(9)HG'(5) 
que é a função de transferência em malha fe- 


chada. 


Item (b): 
C*(s) o“ HG (s) 
Rr(s) 1+ HG (s)D*(s) 
C(z) He(:) 


5.3 


Neste caso testam-se n + 1 = 4 restrições, 
que são 


0,05 > 0 
(-1)(-1-1,8-1,05-0,2) > 0 
02 < 1 

0,96 > 0,69, 


que são todas verdadeiras. Portanto Q(z) = 
O não tem raízes fora do círculo de raio uni- 
tário. 


5.6 


Ganho CC diz respeito a frequência nula, 
portanto temos 


K(s—-z)(s— 2z2)...(s— zm) 
(s—pi)(s— p2)...(s— pn) Is-o 
K(-z)(—22)...(—-2zm) 
(=pi)(=po) = (pn) 


Ganho CC de F(s) = 


5.9 


Os dois primeiros itens podem ser respondi- 
dos a partir do esboço do lugar das raízes 
usando a função de transferência em malha 
aberta em 2. 

O valor crítico do ganho é K = (2 + 
2e“D/(1 — e-“7), que é obtido aplicando- 
se o critério e estabilidade de Jury para a 
equação característica de malha fechada em 
Z: 


5.14 


Para a primeira equação característica tem- 
se: 


QUI E 10, 200 
Ol=0 cs Oia 58585 
0,5 + K0,075 < 1, K<6,6667. 


Para a segunda equação característica tem- 
se: 


Q(1) > 0, K>0 
-Q(-1) > 0, K < 66,6667 
1K0,075-0,5] < 1, —6,6667<K <20 
[K20,0752 — K0,075 — 0,55] < |- K0,3 — 0,5] 
[K20,0752 — K0,075 — 0,55] < K0,3+0,5 


-K0,3— 0,5 < K20,075? — K0,075 — 0,55 < K0,3+0,5. 


A última linha resulta nas seguintes desigual- 
dades: 


K20,0752 — K0,225- 0,25 < O 
K20,0752 — KO,375— 1,25 > 0, 


sendo que da primeira se obtém —41,0819 < 
K < 1,0819. Portanto, o valor críticoo é K = 
1,0189. 


Capítulo 6 


6.1 


A resposta em frequência em questão deve 
subir aproximadamente 15 dB, ou seja, Kp = 
105/20 x 5,6. Lembre-se que o ganho em dB 
é dado por 2010g,, Kp. 


6.2 


O erro de posição é zero e o erro de velo- 
cidade é 1/K. 


6.7 


A resposta pode ser encontrada no vídeo 
https://youtu.be/HrPDM78H3Hk. 


6.12 


6.10 


189 - 0,41727! + 0,0282772 


Dide 
(o 0,3052-1 + 0,6952-2 
6.12 
138922 — 16672 + 0,2778 
D(z) =, k) z ki z + E! 


22 — 0,3056 + 0,6944 


Capítulo 7 


7.6 


Note o atraso adicional na entrada: 


a(k+1) = S = | eco Ç Jun) 


ylk) = [93 OJo(k). 


7.15 


A representação do sistema em tempo con- 
tínuo tem matrizes: 


Ac 


II 
[e 
Do 
om 
H 
Los 
vo 
[e] 
II 
== 
H 
oo 
Los 


Ce = [1 0] De=o0. 


A matriz A pode ser obtida por meio de (7.62) 
— use o comando expm no Matlab — ou usando 
a aproximação (7.64). O vetor b pode ser ob- 
tido usando a aproximação (7.65). 


7.20 


2,22 + 0,38 22 + 0,4 3 


G(z) = à 
(3) z2+0,82=1,54. 2240;32—1,54 "2-1 


Capítulo 8 


8.3 


A lei de controle solicitada é: 
u(k) = —[01-1,7  0,72-05]xe(k). 
8.6 


Seguindo os mesmos passos da Sec. 8.2.2, 
chega-se a: 


=[(c"-dK)(2l-A+bK) Ib+ d]N. 
Capítulo 9 


9.2 
A função de transferência é: 


Y(z) “10422 +052+03 
= 2 o 
U(z) 22- Oz — 05 


